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и 为 想 要 了 解数 字 图 像 处 理 与 机 器 视觉 领域 的 读者 
提供 了 一 条 扎实 的 进 阶 之 路 ， 从 基本 的 图 像 处 理 
EDZ, Т@йи Яс На ЕЕЕ АЫ НН. HH 
特征 提取 、 分 类 器 设计 ， 以 及 光学 字符 识别 、 人 
脸 识 别 等 综合 案例 ， 一 步 步 地 引导 读者 从 阅读 中 
获得 知识 ， 于 实践 中 提升 技能 。 

а Visual C++ 与 Matlab 两 种 语言 开发 无 
缝 连接 ， 体 现 出 科学 研究 和 工程 实践 在 图 像 处 理 
与 机 器 视觉 领域 的 完美 结合 。 
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内 容 近 要 


本 书 将 理论 知识 、 科 学 研究 和 工程 实践 有 机 结 
合 起 来 ， 内 容 涉 及 数字 图 像 处 理 和 识别 技术 的 方 方 
面 面 ， 包 括 图 像 的 点 运算 、 几 何 变 换 、 空 域 和 频 域 
е. ЈАР. ЫЛ. ЕН. ÉA 
FARE, ТЕ. КИ JE hi AN Т FRIE EH 
ч; [БШ АЛЛ Г HU ТЕНК Л, 重点 介 
绍 了 3 种 目前 在 工程 技术 领域 非常 流行 的 分 类 技术 
人 工 神经 网 络 (ANN) 、 支 持 向 量 机 
(SVM) 和 AdaBoost， 并 在 配套 给 出 的 识别 案例 中 
直击 光学 字符 识别 (OCR) 、 人 脸 识 别 和 性 别 分 类 
等 热点 问题 。 


全 书 结构 宁 次 ， 内 容 深 入 浅 出 ， 讲 解 图 文 并 
戊 ， 适 合 于 计算 机 、 通 信和 和 目 动 化 等 相关 专业 的 本 
科 生 、 研 究 生 ， 以 及 工作 在 图 像 处 理 和 识 列 领 域 一 
线 的 三 大 工程 扩 术 人 员 岗 谈 参 考 。 
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КОЖ ДЕЛШ ЕЛ. s nr, e ЗАВР НА Н 
DATIRATI, MH Z, KERARI. E 
Ж, РЕВЕ Л СВЕ. KIRI ЛЕН Ж ANLE ВЕ 
1527) KERRE, HUAI НИ u EEA F 
m— M Н 8 Е ЕН SARE BARCI 
| COCR) 和 汽车 目 动 芝 驶 ， 到 医学 应 用 中 的 病灶 
习 测 与 分 析 ， 上 再 到 未 来 人 机 知 能 区 互 领域 中 的 人 脸 
Rah ARES, BAADENE HAE АГУ 
оноон 


和 图 像 相 关 的 东西 往往 容 多 引起 计算 机 初学 者 
的 兴趣 ， 笔 痢 和 在读 本科 的 时 候 吏 觉得 能 让 计算 机 理 
解 所 “看 ?到 的 东西 是 一 件 非 铝 神秘 和 令 人 兴 香 的 事 
Їз; 但 同时 乞 的 理论 性 较 踢 ， 门 他 较 局， 在 各 个 高 
校 中 ， 这 门 诛 程 大 多 也 是 作为 计算 机 专业 研究 生 的 
选修 诛 程 。 要 理解 议 领 域 的 车 识 ， 谈 者 需要 有 具有 一 
定 的 数学 基础 ， 除 此 之 外 还 涉及 信 忆 处 理 、 统 计 分 
析 、 模 式 识 列 和 机 占 学 习 等 专业 领域 知识 ， 因 此 令 
很 多 人 望而却步 。 


其 实 “ 难 以 理解 ”的 天 键 在 于 缺乏 必要 的 先 序 知 
识 ， 造 成 了 读者 在 相关 知识 上 难以 跨越 的 鸿沟 。 在 


默写 本 书 过 程 中 ， 对 于 可 能 造成 读者 理解 困难 的 地 
方 ， 均 尽 可 能 地 给 出 了 必要 的 基本 知识 ， 深 入 浅 

出 ， 尽 量 定性 地 去 描述 ， 对 于 那些 并 不 一 目 了 然 的 
结论 均 给 出 了 思路 和 解释 ， 必 要 的 还 提供 了 证 明 ， 
对 于 某 些 非常 专业 已 经 超过 本 书 讨论 范围 的 相关 知 
识 在 最 后 给 出 了 参考 文献 ， 供 有 兴趣 的 谈 者 进一步 
学 习 和 研究 。 


KPR A EE RAIAR E, A 
讯 痢 的 思维 方法 ， 使 读 痢 知 其 然 还 要 知 其 所 以 然 ， 
并 在 解决 实际 问题 中 能 有 目 己 的 想法 。 


1. 内 容 安 排 


本 书 在 第 一 版 的 基础 上 ， 根 据 拉 术 的 发 展 和 应 
用 的 需求 进行 改版 ， 主 要 内 容 介 绍 如 下 。 


第 0 一 2 革 介 绍 了 数字 图 像 处 理 的 基础 知识 和 编 
程 基 础 ， 使 读者 第 一 步 能 够 建立 起 对 于 数字 图 像 本 
质 的 正确 认识 ，J 了 了解 和 掌握 必要 的 术语 和 预备 知 
识 ， 并 且 丈 芒 本 书目 始 至 终 需 要 使 用 的 两 大 工具 
MATLAB 和 Visual C++， 给 出 了 功能 强大 的 C++ 数 
字 图 像 处 理 基 类 CImg 及 其 派生 类 CImgProcess 的 框 
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第 3 一 4 章 分 别 介绍 了 图 像 的 灰 度 变换 和 几何 变 


换 。 通 过 灰 度 变换 可 以 有 效 改 善 图 像 的 外 观 ， 并 在 
一 定 程 度 上 实现 图 像 的 灰 上 度 归 一 化 ， 几何 变换 则 主 
要 应 用 在 图 像 的 几何 归 一 化 和 图 像 校 准 当 中 。 忆 体 
而 言 ， 这 些 内 容 大 多 作为 图 像 的 前 期 预 处 理工 作 的 
一 部 分 ， 征 图 像 处 理 中 相对 固定 和 程 陈 化 的 内 容 。 


435-628 7371] М. Z [н] ЖИЛ ЖИ РА 1 ВЕ 2: 5 
量 图 像 增强 的 各 个 主要 方面 。 图 像 增强 作为 数 子 图 
像 处 理 中 相对 窗 单 却 最 有 具 乞 术 性 的 领域 乙 一 ， 可 理 
解 为 根据 特定 的 需要 突出 一 幅 图 像 中 的 未 绎 信息 ， 
间 时 ， 削 弱 或 去 除 东 些 人 不 需要 的 信息 的 处 理 方 法 。 
其 主要 目的 是 使 处 理 后 的 图 像 对 未 种 特定 的 应 用 来 
说 ， 比 原始 图 像 更 适用 。 


第 7 草 小 波 变 换 继 此 6 草 之 后 继续 在 频率 域 中 人 研 
乞 图 像 。 伟 里 时 变换 一 直 古 频率 域 图 像 处 理 的 基 
石 ， 它 能 用 正 余 嘴 图 数 之 和 表示 任何 分 析 图 数 ， 而 
小 波 变 换 则 基于 一 些 有 限 宽 度 的 葵 小 波 ， 这 些小 并 
人 不仅 在 频率 上 古 变 化 的 ， 而 且 上 只 有 有 限 的 持续 时 
Ін]. БУА, АЈА МУ ВЕЗЕ ИЯ 
ARE Т ННН | ТАНАН Эра, (Нуе 
т теттин, ЕИИЕеТ 


第 8 草图 像 复 原 与 图 像 增强 相似 ， 其 目的 也 是 
改善 图 像 质 量 。 但 是 图 像 复 原 古 试图 利用 退化 过 程 


JS АПАЛ ЖОАН КИЯ ЖКУ А Н, Tü ES 
КЛ 2 H ЖЛ ТАТК J NU ВЧИЛА а, ДЕЛУ 
ЛАКАЛ м. j OE, G ERRIBERA ж БЕЛЕН Ж 
学 系统 、 运 动 竺 造成 的 图 像 模糊 ， 以 及 源 目 电路 和 
光学 因 系 的 噪声 等 。 图 像 复 原 是 基于 图 像 退 化 的 数 
ORT sar 


第 9 草 征 本 书 中 相对 独立 的 一 草 ， 以 介绍 色彩 
模型 之 间 的 相互 转换 以 及 彩色 图 像 处 理 方 面 的 基本 
概念 和 基本 方法 为 主 。 随 腹 葵 于 互联 网 的 图 像 处 理 
应 用 在 不 断 增 长 ， 彩 色 图 像 处 理 已 经 成 为 一 个 重要 
领域 。 


第 10 章 网 像 压 缩 和 在 减少 表示 数字 图 像 时 需要 
的 数据 量 。 主 要 介绍 了 图 像 压缩 的 基本 原理 、DCT 
ASe, MWM ER SmE, AUREN AN 
洲 程 编码 等 知识 ， 并 给 出 了 有 关 JPEG 和 JPEG2000 
压缩 标准 的 内 容 。 


5117-13 ОЁ ле КИЯЛ, КИЖИ, HF 
#Ejel EMEA Ж МЕН [я] ЫЙЛА ОЛ тЇ, 
ж) AR, APRIRE R ХЕЧ Л. хе РИ, Fah 
ХЕЕЕ Е КОКУ ос. МА 
ВЕН S| u В 77570, CERAR 
状 方面 非 第 有 用 ; 分 割 过 程 则 将 一 幅 图 像 划 分 为 组 


ВЕН HERAT Z: ТУЕ АЕ HXI е ЖЛ НИ ФЕ 
取出 来 的 图 像 元 系 或 目标 对 象 表 示 为 适合 计算 机 后 
续 处 理 鸭 数值 形式 ， 最 终 形成 能 够 且 接 供 分 类 可 使 
用 的 特征 。 


第 14 草 在 前 面 知识 的 基础 之 上 ， 引 出 了 宙 硕 视 
觉 的 前 导 性 内 容 ， 给 出 了 解决 识别 问题 的 一 般 轧 
路 。 


最 后 3 章 (人 工 神 经 网 络 、 文 持 回 量 机 和 
AdaBoost) 介绍 了 3 种 十 分 强大 的 分 类 技术 ， 并 在 
手 与 数字 字符 识别 、 人 脸 识 列 和 性 列 分 类 这 样 的 经 
И. RAP ЖЖ ТУЕ 
2. Ах 

° 大 学 二 年 级 以 上 《有 具备 必要 的 数学 基础 ) 的 相 
天 专业 的 本 科 生 、 研 究 生 。 
° 工作 在 图 像 处 理 和 识别 领域 一 线 的 工程 技术 人 


ne 
|° РСЧА ан КУШЫП ЛЕ H. Ж 
备 必 了 要 预 备 知 识 的 所 有 谈 者 。 


З. 在 阅读 本 书 之 前 ， 扇 着 最 好 其 有 如 下 的 预备 知 
IH 


ҮА 


。 读者 应 该 熟悉 C++ 编程 语言 和 面向 对 象 的 基本 思 


想 。 书 中 的 相当 一 部 分 示例 是 以 C++ 语 言 描述 
的 


。 读者 应 具备 一 定 的 数学 基础 ， 主 要 的 高 等 数学 
知识 、 少 量 的 线性 代数 基本 概念 加 上 对 于 概率 
理论 主要 思想 的 理解 〈 识 别 部 分 ) 。 


4， 附 书 光 和 到 和 读者 反馈 


本 书 所 有 Visual C++ 实例 的 源 代 但 和 大 部 分 
Matlab K IRRIS EY AJ E BE E MIS MGR P ER 
1]. ZJ Г АВЕ ENAREN, АНЕ y 
C++ 代码 的 Visual C++ 6.0 版 本 和 Visual Studio 
2010/2012 版 本 。 里 然 本 书 中 的 所 有 例子 都 已 经 在 
Windows XP. Windows 2003 和 Windows7 和 下 测试 通 
过 ， 但 由 于 许多 算法 比较 复杂 且 笔 者 水 平局 了 上限， 也 
有 存在 咏 隐 的 可 能 ， 即 便 正确 也 很 可 能 存在 更 加 优 
化 的 算法 或 更 加 合理 的 程序 结构 ， 如 发 现任 何 上 述 
问题 ， 欢 迎 谈 者 通过 以 下 方式 联系 本 书 作 者 ， 以 便 
做 出 改进 。 


邮箱 : book95_editor@qq.com 
腾讯 微 博 : @Book95_Aaron 
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HOE PRAT Ab ан 
ДИГИ 


А Н ВЕЕ A В А ЕА ЕП 
的 客观 对 象 ， 包 括 目 然 景 物 、 拍 摄 到 的 图 片 、 用 数 
学 方法 描述 的 图 形 等 。 图 像 的 有 要么 有 几何 要 又 (4 
画 对 象 的 轮廓、 形状 等 ) 和 非 几 何 要 素 〈 刻 画 对 象 
НИЛЕ. МЛ) 。 


KEP, EEH EAMA y S| АБИ) 
实质 内 容 和 一 般 步 又 ， 以 及 一 些 后 面 会 经 党 使 用 到 
的 葵 本 概念 。 


01 ”数字 图 像 


目 然 界 中 的 图 像 都 是 模拟 量 ， 在 计算 机 普 授 应 
用 之 前 ， 电 视 、 电 影 、 照 相机 等 网 像 记 录 与 传输 设 
рона аа Ате е 
机 只 能 处 理 数 字 量 ， 而 不 能 直接 处 理 模拟 图 像 。 所 
以 要 在 使 用 计算 4 机 处 理 图 像 之 前 进 HÍT ЕЮ RFM o 


0.11 ПАЖ ТИ 
Г Ja, ЭКЕЙ ВЕЕТ Г. л 





和 处 理 的 图 像 ， 可 根据 其 特性 分 为 两 大 类 一 — K 
和 矢量 图 。 位 图 退 和 党 使 用 数字 阵列 来 表示 ， 雪 见 格 
式 有 BMP、JPG、GIF 等 ; RER HAREA JEK 
示 ， 接 触 最 多 的 束 是 PNG 图 形 。 


本 书 只 涉及 数字 图像 中 位 图 图 像 的 处 理 与 识别 ， 如 无 特 列 说 明 ， 
后 文 拓 到 的 “图 像 * 和 “数字 图 像 * 都 仅仅 是 指 位 图 图 像 。 一 般 而 言 ， 使 
用 数 子 摄像 机 或 数字 照相 机 得 到 的 图 像 都 是 位 图 图 像 。 


将 一 幅 图 像 视 为 一 个 二 维 函 数 f(x ,y )， 其 中 x 
My 是 空间 坐标 ， 而 在 x 一 y 平面 中 的 任意 一 对 空间 
坐标 (x ,y ) 上 的 幅 信 了 称 为 该 点 图 像 的 灰 度 、 腕 度 
或 强度 。 此 时 ， 如 果 f、x、y 均 为 非 负 有限 离散 ， 
Лт ЧУС ИА (位 图 ) 。 


一 个 大 小 为 M хм 数字 图 像 十 由 M 行 N 列 的 有 
了 眼 元 系 组 成 的 ， 每 个 元 系 部 有 有 特定 的 位 置 和 幅 值 ， 
代表 了 其 所 在 行列 位 置 上 的 图 像 物理 信息 ， 如 灰 度 
和 色彩 等 。 这 些 元 系 称 为 图 像 元 系 RAR 。 


012 ZT BZP EZ 


不 论 是 CRT 显 示 器 还 是 LCD 显 示 器 ， 都 是 由 许 
多 点 构成 的 ， 显 示 图 像 时 这 些 点 对 应 着 图 像 的 像 
系 ， 称 显示 右 为 位 映像 人 设备。 所谓 位 映像 ， 束 是 一 
个 二 维 的 像素 和 矩阵， 而 位 图 也 就 是 采用 位 映像 方法 


ЖУЛ J. `4 П ЧИ X ai mü Н] 
以 明显 地 看 出 图 像 是 由 很 多 方 格 形状 的 像 系 构成 
的 ， 如 图 0.1 所 示 。 





图 0.1 位 图 图 像 示例 


013 ”数字 图 像 的 分 类 

根据 每 个 像素 所 代表 信息 的 不 同 ， 可 将 图 像 分 
为 二 值 图 像 、 灵 度 图 像 、RGB 图 像 以 及 索引 图 像 
1. 二 值 图 像 

每 个 像 际 只 有 黑 、 昌 两 种 凑 色 的 图 像 称 为 二 值 
独 像 。 在 二 信 疼 像 中 ， 像 系 只 有 0 和 1 两 种 取信 ， 
一 般 用 0 来 表示 黑色 ， 用 1 表示 和 白色。 
2. KE BZ 


在 二 值 图 像 中 进一步 加 入 许多 介 于 黑色 与 白色 
之 间 的 颜色 深度 ， 就 构成 了 灰 度 图 像 。 这 类 图 像 
通常 显示 为 从 最 暗黑 色 到 最 亮 的 白色 的 灰 度 ， 每 种 
KE MERE) 称 为 一 个 灰 度 级 ， 通 常用 L 表 
示 。 在 灰 度 图 像 中 ， 像 素 可 以 取 0~ 工 -1 之 间 的 整数 
值 ， 根 据 保存 灰 度 数值 所 使 用 的 数据 类 型 不 同 ， 可 
能 有 256 种 取 值 或 者 说 2“ 种 取 值 ， 当 k =1 时 即 退 化 
为 二 值 图像 。 


3. RGB 图 像 


众所周知 ， 目 然 界 中 几乎 所 有 凑 色 都 可 以 由 红 
(Red, В) 、 绿 (Green, С) ~ їй (Blue, В) З 
色 组 合 而 成 ， 通 第 称 它 们 为 RGB 三 原色 。 计 算 机 显 
示 彩 色 图 像 时 来 用 最 多 的 融 是 RGB 模型 ， 对 于 每 个 
像素 ， 通 过 控制 R、G、B 三 原色 的 合成 比例 决定 该 
像素 的 最 终 显示 颜色 。 


对 于 三 原色 RGB 中 的 每 一 种 凑 色 ， 可 以 像 灰 撤 
图 那样 使 用 LL 个 等 级 来 表示 含有 这 种 颜色 成 分 的 多 
少 。 例 如 对 于 售 有 256 个 等 级 的 红色 ，0 表 示 不 售 红 
色 成 分 ，255 表 示 含 有 100% 的 红色 成 分 。 同 样 ， 绿 
色 和 蓝 色 也 可 以 划分 为 256 个 等 级 。 这 样 每 种 原色 
可 以 用 8 位 二 进 制 数据 表示 ， 于 是 3 原色 总 共 需 要 24 
位 二 进 制 数 ， 这 样 能 够 表示 出 的 赢 色 种 类 数目 为 
256x256xx256=2“4 ， 大 约 有 1600 万 种 ， 已 经 远 远 


超过 普通 和 人 所 能 分 状 出 的 欺 色 数目 。 


RGB 闫 色 代 人 码 可 以 使 用 十 六 进 制 数 减少 书写 长 
上 度 ， 按 照 两 位 一 组 的 方式 依次 书 与 R、G、B 三 种 两 
色 的 级 别 。 例 如 : 0xFF0000 代 表 纯 红色 ，0x00FF00 
代表 纯 绿 色 ， 而 0x00FFFF 是 青色 (这 是 绿色 和 蓝 色 
的 加 和 ) 。 当 RGB 三 种 两 色 的 浓度 一 致 时 ， 所 表示 
的 颜色 束 退 化 为 灰 度 ， 比 如 0 x808080 束 是 50% 的 灰 
Е, 0х0000005 8 а, ПОхЕЕЕЕЕЕ Н. Л, 
ИЛЕ ЈЕСВН SE 4120.137. 
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未 经 压缩 的 原始 BMP 文件 惑 是 使 用 RGB 标准 给 
出 的 3 个 数值 来 存储 图 像 数据 的 ， 称 为 RGB 图 像 。 
在 RGB 图 像 中 每 个 像 系 都 是 用 24 位 二 进 制 数 表 示 ， 
故 也 称 为 24 位 真 彩 色 图 像 。 


4. 索引 图 像 


如 末 对 每 个 像 际 都 和 直接 使 用 24 位 二 进 制 数 表 
示 ， 图 像 文件 的 体积 将 变 得 十 分 庞大 。 来 看 一 个 例 
子 ， 对 一 个 长 、 宽 各 为 200 像 素 ， 颜 色 数 为 16 的 彩 
色 图 像 ， 每 个 像素 都 用 RGB 三 个 分 量 表 示 。 这 样 每 
个 像 隶 由 3 个 字 贡 表示 ， 人 整个 图 像 丈 是 
200x200x3=120KkKB。 这 种 完全 未 经 压缩 的 表示 方 
wo RA S RENTET, FERETE A 
更 节省 空间 的 存储 方式 : 索引 图 像 。 


同样 还 是 对 200x200 人 像素 的 16 色 图 像 ， 由 于 这 
张 图 上 乒 中 最 多 只 有 16 种 凑 色 ， 那 么 可 以 用 一 张 闫 色 
KR 〈16x3 的 二 维 数 组 ) 保存 这 16 种 两 色 对 应 的 RGB 
值 ， 在 表示 图 像 的 算 阵 中 使 用 那 16 种 其 色 在 两 色 表 
中 的 索引 【〔 偏 移 量 〉 作为 数据 写 入 相应 的 行列 位 
置 。 人 例如， 两 色 表 中 第 3 个 元 兹 为 0xAA1111， 那 么 
在 图 像 中 所 有 颜色 为 0xXAA1111 的 像素 均 可 以 由 3- 


1=2 表 示 〈 闫 色 表 索引 下 标 从 0 开始 〉。 这 样 一 来 ， 
每 一 个 像素 所 需要 使 用 的 二 进 制 数 束 仅 仪 为 4 位 
(05) ， 从 而 整个 图 像 只 需要 
200x200x0.5=20kB 束 可 以 存储 ， 而 不 会 影 啊 显 示 质 


== | 


—n—o- 
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上 文 所 指 的 颜色 表 束 是 第 说 的 调 色 板 
(Palette) ， 另 一 种 说 法 叫 作 两 色 答 找 表 (Look 
Up Table, LUT) 。Windows 位 图 中 应 用 到 了 调 色 
板 技 术 。 其 实 不 仪 是 Windows 位 图 ， 许 多 其 他 的 图 
нна TIF、GIF 都 应 用 了 这 种 技 


在 实际 应 用 中 ， 调 色 板 中 通 第 只 有 少 于 256 种 
的 颜色 。 在 使 用 许多 网 像 编 辑 工具 生成 或 者 编辑 
GIF 文 件 的 时 候 ， 和 党 沼 会 近 示 用 尸 选 择 文件 包含 的 
颜色 数目 。 当 选择 较 低 的 其 色 数 目 时 ， 将 会 有 效 地 
降低 图 像 文件 的 体积 ， 但 也 会 一 定 程度 上 降低 图 像 
的 质量 。 


使 用 调 色 板 技 术 可 以 减 小 图 像 文件 体积 的 条 件 
尽 图 像 的 像 系数 目 相 对 较 多 ， 而 闫 色 种 类 相对 较 
少 。 如 来 一 个 图 像 中 用 到 了 全 部 的 24 位 有 具 彩色 ， 对 
其 使 用 闫 色 合 找 表 技术 是 完全 没有 意义 的 ， 辕 纯 从 
BE ЛЕМ ЖАЙТ ЖАЙ лє ЛУН] НЕ): 
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实际 上 ，0.1.1 小 市 中 对 于 数字 图 保 f (x ,y) 的 定 
义 仅 适 用 于 了 最 为 一 上 股 的 情况 ， 即 静态 的 灰 度 网 像 。 
更 严格 地 说 ， 数 字 岁 像 可 以 是 2 个 变量 〈 对 于 静止 
1%, Static Image) 或 3 个 变量 〈 对 于 动态 男 甸 ， 
Video Sequence) WARAN. EERS RARI TE OL 
ж (х,у), MURES, ME ЫН] |Н) & 
Zt, EBlf(x,y,t). ИНВЕ ТЭН СР 
“шш ‚ ЧН ЕЕ -cE (А Т 2 9 

J g 





前 仿 的 灰 度 图 像 是 本 书 研究 的 主要 对 象 ， 对 于 函数 值 为 回 量 的 情 
况 会 在 第 9 半 彩 色 图 像 处 理 中 阐述 。 


图 像 处 理 是 一 个 涉及 诸多 研究 领域 的 交叉 学 
科 ， 下 面 就 从 不 同 的 角度 来 审视 数字 图 像 


(1) 从 线性 代数 和 和 抢 阵 论 的 角度 ， 数 字 图 像 
就 是 一 个 由 图 像 信 息 组 成 的 二 维 矩 阵 ， 和 矩阵 的 每 个 
元 素 代 表 对 应 位 置 上 的 图 像 亮 度 和 /或 色彩 信息 。 当 
然 ， 这 个 二 维 窍 阵 在 数据 表示 和 存储 上 可 能 不 是 二 
维 的 ， 这 是 因为 每 个 单位 位 置 的 图 像 信息 可 能 需要 
不 只 一 个 数值 来 表示 ， 这 样 可 能 需要 一 个 三 维和 矩阵 
来 对 其 进行 表示 (参见 1.2 节 关于 Matlab 中 RGB 图 像 


表示 的 介绍 ) 。 


(2) 由 于 随机 变化 和 噪声 的 原因 ， 图 像 在 本 
质 上 是 统计 性 的 。 因 而 有 时 将 图 像 函 数 作 为 随机 过 
程 的 实现 来 观察 其 存在 的 优越 性 。 这 时 有 天 图 像 信 
恩 量 和 几 余 的 问题 可 以 用 概 座 分布 和 相关 函数 来 摘 
述 和 考虑 。 例 如 ， 如 果 知 道 概 率 分 布 ， 可 以 用 炉 
Кё HO Жа, KEFE 
论 中 一 个 重要 的 思想 。 


(3) 从 线性 系统 的 角度 若 夸 ， 图 像 及 其 处 理 
H aJ ARR НКА а ИНС ЛА НОЈ ка ЛЕЈТЕ РА 4 
的 登 加 ， 在 使 用 这 种 方式 对 图 像 进 行 表 示 时 ， 可 以 
来 用 成 熟 的 线性 系统 理论 研究 。 在 大 多 数 时 候 ， 者 
考虑 使 用 线性 系统 近似 的 方式 对 图 像 进行 近 似 处 理 
以 向 化 算法 。 虽 然 实际 的 图 像 并 不 是 线性 的 ， 但 十 
rd 


0.15 ЖКДАН 


为 了 表述 像素 之 间 的 相对 和 绝对 人 位置， 通常 还 
需要 对 像 系 的 位 置 进行 坐标 约定 。 本 书 中 所 使 用 的 
坐标 约定 如 图 0.2 所 示 。 但 A ARREN 的 约 
定 会 有 人 释 化 ， 具 体 请 参见 1.1.5 小 市 


原点 О 193 mi Р N-1 





402 Zer BRAR E 
(EX Дл, iA E BRF Y ЭСТЕ 
БЕ, ЛУИ УВЕ АР ОХ о ЧИ 
НУЛЕ а РУХ 
ft0, 0) z fO, N — 1) 
fly, 7) = | | 


JM = 1 жш FU —1.N — 1) 


(0-1) 


有 时 也 可 以 使 用 传统 算 阵 表示 法 来 表示 数字 和 图 
AIR, ИП F KEYS. 


(0.0 т (O N —1 
А = a, 
a -1,0 5 ОА 1. №1 
(0-2) 


其 中 行列 (M 行 N AD 必须 为 正 整 数 ， 而 离散 
灰 度 级 数目 工 一 般 为 2 的 KK 次 守 ， 天 为 整数 〈 因 为 使 
用 二 进 制 整 数值 表示 灰 硫 值 )， 图 像 的 动态 沁 围 为 
L-1], ЖАВ РТА M EFFO b = M xN 

。 注 意 到 在 矩阵 f (y,x) 中 ， 一 般 习 惯 于 先行 
后 列 下 标的 表示 方法 ， 因 此 这 里 先是 纵 坐 
标 y СЛУ), АЯ Ах 〈 对 应 列 ) 。 


而 有 些 图 像 闪 阵 中 ， 很 多 像 系 的 值 都 是 相同 
的 。 "S л 
№, X< жИН 20. ОЕ EAK ZJ 
ХЕ [E (Sparse Matrix) , аваа 
ПАИ а ЖИК, KEWAA. О 
Ж | i ДУ ИКЕ пу НЕ ФЕ КИР o 


0.16 НН АКВ УУ Ж 


1. RHET EIIE (Spatial Resolution) 


КОЛ) T ЇН) 27 74 qa A rH ЕЕН. yr В P 
За ЖН, MRAR) (pixels рег 
inch, ppi〉 为 时 位 来 表示 。 如 72ppi 表 示 图 像 中 每 天 
十 包含 72 个 像 尿 或 点 。 分 状 蒜 越 局 ， 图 像 将 越 清 
晰 ， 图 像 文 件 所 需 的 磁盘 空间 也 越 大 ， 编 辑 和 处 理 
所 需 的 时 间 也 越 长 。 


像素 越 小 ， 单 位 长 度 所 包含 的 像素 数据 惑 越 
多 ， 分 辨 率 也 就 越 高 ， 但 同样 物理 大 小 范围 内 所 对 
应 图 像 的 尺寸 也 会 越 大 ， 存 储 图 像 所 需要 的 字 节 数 
也 越 多 。 因 而 ， 在 图 像 的 放大 缩小 算法 中 ， 放 大 残 
是 对 图 像 的 过 采样 ， 缩 小 是 对 图 像 的 从 采样 ， 这 些 
会 在 4.5 节 图像 缩 放 中 进一步 介绍 。 


一 般 在 没有 必要 对 涉及 像素 的 物理 分 辩 率 进行 
实际 度量 时 ， 通 常会 称 一 幅 大 小 为 M xN 的 数字 图 
像 的 空间 分 辩 率 为 M xN 像素 。 


图 0.3 给 出 了 同一 幅 图 像 在 不 同 的 空间 分 辨 率 下 
“ИН ЕУ ЛУН ЖЯ» HENIE КРЕ ИКЭ 
率 表 示 时 ， 在 同等 的 显示 或 者 打印 输出 条 件 下 ， 锋 
像 的 厂 寸 灾 小 ， 细 区 变 得 不 明 最 ; 而 当 将 低 分 辩 率 
下 的 图 像 放 大 时 ， 则 会 叶 臻 图像 的 细 太 仍然 模糊 ， 
只 是 尺寸 变 大 。 这 是 因为 缩小 的 图 像 已 经 丢失 了 大 
量 的 信息 ， 在 放大 图 像 时 只 能 过 过 复制 行列 的 插值 
的 方法 来 确定 新 增 像 系 的 取 值 。 


BLOGWOW ~er f 
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Коз ”图 像 的 空间 分 辨 率 一 一 一 幅 分 辩 率 为 1024x1024 的 图 像 
逐次 减少 至 32x32 的 分 辨 率 


2. KEKKERIT н? УД (Radiometric 


Resolution ) 


ТЕСТ ККАН, KERNIE EK 
‚ ЎН НЕ УЭЛ АЛЕН, ВСЕ АЧ 
灰 度 级 数目 L ， 它 与 存储 灰 度 级 列 所 使 用 的 数据 类 
WARK. ШРК а НЕ СЯ ER ан ЕЭС 
Ч (А НУ, MARKERNI Ц pyar ypt 





БВ И J JK 2 ЦАМ, BAFE 
ЈЕ H 22, ЛЕЕ ЈА л БИ ЇЙ fE 
恩 受 损 ， 同 样 使 图 像 细 市 表达 受到 了 一 定 的 影响 ， 
如 图 0.4 所 示 。 





04 图 像 的 灰 度 级 分 辩 鞭 一 ”分别 具有 256、32、16、8、4 
和 2 个 灰 度 级 的 一 幅 图 像 
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0.2.1 ”从 图 像 处 理 到 图 像 识 别 


图 像 处 理 、 图 像 分 析 和 图 像 识 别 是 认 知 科学 与 
计算 机 科学 中 的 一 个 令 人 人 兴 否 的 活路 分 文 。 从 1970 
年 这 个 领域 经 历 了 人 们 对 其 兴趣 的 煤 炸 性 增长 以 
Ж, 220120 220727 АК. KEPER, БЕМ 
т. ВЕЕ А07. РАУ А 
AJI AM де е СЕ НУ rn], ОСЕ Бене 


中 地 体现 在 市 场 上 多 种 应 用 这 类 拉 术 的 产品 的 纷纷 
涌现 。 事 实 上 ， 从 数 子 图 像 处 理 到 数 子 图像 分 析 ， 
再 肥 展 a 到 最 前 沿 的 图 像 识 列 技 术 ， 其 核心 部 十 对 数 
子 图 像 中 所 含有 的 信息 的 近 取 太 与 其 相关 的 各 种 辅 
助 过 程 。 


1. УНИ 


数字 图 像 处 理 (Digital Image Processing) Wi 
是 指使 用 电子 计算 机 对 量化 的 数字 图 像 进 行 处 理 ， 
其 体 地 说 开 是 通过 对 图 像 进行 各 种 加 工 来 改 赭 图像 
的 外 观 ， 是 对 图 像 的 修改 和 增强 。 


图 像 处 理 的 输入 是 从 传 感 带 或 其 他 来 源 获 取 的 
原始 的 数字 图 像 ， 输 出 是 经 过 处 理 后 的 输出 图 像 。 
处 理 的 目的 可 能 征 使 输出 图 像 具 有 更 好 的 效 末 ， 以 
便于 人 的 观察 ; 也 可 能 古 为 图 像 分 析 和 识别 做 惟 
备 ， 此 时 的 图 像 处 理 是 作为 一 种 预 处 理 ЛУН, H 
出 图 便 将 进一步 优 其 他 图 像 进 行 分 机 、 识 列 算 法 。 


2. 数字 图 像 分 析 


数字 图 像 分 析 (Digital Image Analyzing) 是 
利 对 向 像 中 感 兴 趣 的 目标 进行 检 训 和 训 量 ， 以 获 
得 客观 的 信息 。 数 字 疼 像 分 析 通 音 是 指 将 一 幅 疼 
像 转 化 为 男 一 和 神 非 图 像 的 抽象 形式 ， 例 如 图 像 中 菏 


物体 与 测量 者 的 距离 、 目 标 对 象 的 计数 或 其 太吉 
等 。 这 一 概念 的 外 延 包 括 边缘 检 测 和 图 像 分 割 、 特 
全 提取 以 及 几何 测量 与 计数 等。 


图 像 分 析 的 输入 是 经 过 处 理 的 数字 图 像 ， 其 输 
出 通 第 个 青 古 数 子 图像， 而 十 一 系列 与 目标 相关 的 
BRE 目标 的 换 述 ) ， 如 目标 的 长 度 、 颜 色 、 
曲率 和 个 数 等 。 


3. 数字 图 像 识 别 


数字 图 像 识 别 (Digital Image Recognition) + 
要 是 研究 图 像 中 各 目标 的 性 质 和 相互 天 系 ， 识 列 出 
目标 对 象 的 类 别 ， 从 而 理解 图 像 的 含义 。 这 往往 吉 
括 了 使 用 数字 图 像 处 理 扩 术 的 很 多 应 用 项 目 ， 例 如 
光学 字符 识别 (OCR) 、 产 品质 量 检 验 、 人 脸 识 
A 
ЁР. 


Иле ЧИТ НОИ, ЛЕ А ENRI 
АТР ЈАН К СРЕ) ХН 147 042, шй 
H BEH ОС НУ H Элли i s CAPS) 。 


总 而 言 之 ， 从 图 像 处 理 到 图 像 分 析 再 到 图 像 识 
别 这 个 过 程 ， 古 一 个 将 所 含 信 息 抽象 化 ， 笑 试 降低 


信息 燃 ， 拓 人 炼 有 效 数 据 的 过 程 ， 如 图 0.5 所 示 。 


六 


天 图 像 识别 小 
抽 数 
和 图 像 分 析 i 
PE E 
小 大 


90.5 ”数字 图 像 处 理 、 分 析 和 识别 的 关系 


Маан Е, ЛЕТА 
и, AE РИА T$ OP uha 
Ив ААР, ПИП ERRE “rE 
分 析 则 是 将 这 些 信息 抽取 出 来 以 供 其 他 过 程 出 用 。 
当然 ， 在 不 太 严格 时 ， 数 子 图 像 处 理 也 可 以 菩 指 图 
像 处 理 和 分 析 。 


该 者 或 许 也 听 过 另 一 个 概念 ， 计 算 机 图 形 学 
(Computer Graphics) 。 此 概念 与 数字 网 像 分 析 
大 致 相反 ， 它 是 一 个 对 由 概念 或 数学 表述 的 物体 各 
像 进行 处 理 和 显示 的 过 程 。 


0.2.2 ”什么 是 机 器 视觉 


机 器 视觉 (Machine Vision) ， 又 称 计 算 机 视 
їй, (Computer Vision) 。 它 是 将 数字 图 像 处 理 和 数 
字 图 像 分 析 、 图 像 识 列 结 合 起 来 ， 试 图 开 友 出 一 种 
能 与 人 脑 的 部 分 机 能 比拟 ， 能 够 理解 目 然 景 物 和 环 
境 的 系统 ， 在 机 右 人 领域 中 为 机 右 人 提供 类 似 人 类 
人 秽 沉 的 芒 能 。 计 算 机 视觉 是 数字 成 像 领 域 的 从 端 方 
п), Аек ЛА RI) YZ НА Pn BI 
提示 

后 文中 ， 如 无 特别 说 明 ， 文 章 通 音 使 用 广义 的 图 像 处理 概 念 ， 即 
用 数字 图 保 处 理 这 个 词 涵盖 上 文 所 提 到 的 图 像 处 理 和 数字 图 像 分 析 ; 


而 对 于 图 像 识 别 和 机 闫 视觉 的 概念 音 和 不 如 区 分 ， 尽 管 严 格 地 说 识 允 
只 对 应 于 高 级 视 涡 的 范 是 。 


0.23 ”数字 图 像 处 理 和 识别 的 应 用 实例 
如 今 ， 数 字 图 像 处 理 与 机 货 视 禹 的 应 用 越 来 越 
三 泛 ， 已 经 渗透 到 国家 安全 、 和 空 航天 、 工 业 控 
制 、 医 疗 傈 健 等 各 个 领域 万 全 人 们 的 日 铅 生 活 和 效 
RAF, ЖКА АБ EEEH. 
Я ВУЛ Н] 2120.207. 


40.2 图像 处 理 与 识别 的 典型 应 用 


相关 领域 





安全 监控 “| 指纹 验证 、 基 于 人 脸 识别 的 门禁 系统 


产品 无 损 检测 、 商 品目 动 分 > 


医疗 保健 “|X 光照 片 增强 、CT、 核 磁 共 振 、 病 灶 自 动 检测 





生活 娱乐 ”| 基于 表情 识别 的 笑脸 目 动 检测 、 汽 车 目 劫 驾驶、 手写 字符 识 别 


下 和 面 结 合 丙 个 典型 的 应 用 来 说明 。 
1. 图 像 处 理 的 典型 条 例 一 一 XX 光照 厂 的 增强 


图 0.6 中 的 两 幅 图 片 ， 图 0.6 (а) 是 一 幅 直 接 拍 
摄 未 经 处 理 的 X 光 照片 ， 对 比 度 较 低 ， 图 像 细 节 难 
以 辨识 ;图 0.6 (b) 中 呈现 了 图 0.6 (а) 经 过 简单 
的 增强 处 理 后 的 效果 ， 图 像 较为 清晰 ， 可 以 有 效 地 
指导 诊断 和 治疗 。 从 中 读者 应 该 可 以 看 出 图 像 处 理 
反 术 在 辅助 医学 成 像 上 的 重要 作用 。 





(а) KEARN Хх ЖА (b) “БИН АН X ЖШ 


0.6 ”图 像 处 理 前 后 的 效果 对 比 


2. 图 像 识 别 的 典型 案例 一 -ALVINN 汽 车 自动 轰 
驶 系统 


著名 的 自动 驾驶 系统 ALVINN 是 人 工 神 经 网 络 
(关于 人 工 神 经 网 络 的 介绍 详 见 第 15 章 ) у 
型 的 应 用 。 访 系统 使 用 一 个 经 过 训练 的 神经 网 络 以 
正常 速度 在 高 速 公 路 上 芍 驶 汽车 。 如 图 0.7 (b) 所 
示 ，ALVINN 具 有 一 个 典型 的 3 层 结构 ， 网 络 的 输 
入 层 共 有 30x32 个 单元 ， 对 应 于 一 个 30x32 的 像素 点 
孟 ， 是 由 一 个 安装 在 车 辆 上 的 前 问 摄 像 机 获取 的 图 
像 经 过 重 采 样 得 到 的 。 输 出 层 共 有 30 个 单元 ， 输 出 
情况 指出 了 车辆 行进 的 方 同 。 


к 1-5 FHH 
A PHI ч 11 


| | u I 
pi ai oe: ЫЫ, я > 30 个 输出 层 单元 








0.7 学习 汽 车 目 动 驾驶 的 ALVINN 系 统 


在 训练 阶段 ，ALVINN 以 人 类 要 驶 时 摄像 机 所 
捕获 的 前 方 区 通 状 况 作 为 输入 ， 以 人 类 通过 操作 方 


[п] ЖШ ИНЖЕ Jy ln ТЕМ H а, ЖТ ҖЕ 
大 约 5 分 钟 在 测试 阶段 ，ALVINN 用 学 习 到 的 网 
络 在 高 速 公 路 上 以 70 现 里 的 时 速成 功 地 要 驶 了 90 珊 
里 。 


(a) 为 车 内 的 摄像 头 和 前 方 的 实际 情况 ; (b) 为 ALVINN 的 网 
络 结构 ， 摄 像 头 捕获 岁 像 的 30x32 的 重 采 样 图 像 被 作为 网 络 的 输入 ， 对 
应 于 960 个 输入 层 单 元 ， 这 些 输入 又 连接 至 4 个 隐藏 单元 ， 再 连接 到 30 
个 输出 单元 ， 输 出 为 一 个 30 维 同 量 ， 相 当 于 把 整个 方 癌 盘 的 控制 范围 
分 成 30 份 ， 每 个 输出 单元 对 应 一 个 特定 的 敬 驶 方 同 ， 决 策 结 果 为 输出 
值 最 大 的 单元 对 应 的 行驶 方向 。 


ОЗ ”数字 图 像 处 理 的 预备 知识 


数字 图 像 是 由 一 组 共有 一 定 的 空间 位 置 关系 的 
像素 组 成 的 ， 因 而 具有 一 些 度 量 和 拓扑 性 质 。 理 解 
像素 间 的 关系 是 学 习 图 像 处 理 的 必要 准备 ， 这 主要 
包括 相 邻 像素 ， 邻 接 性 、 连 通 性 ， 区 域 、 边 界 的 概 
念 ， 以 及 今后 要 用 到 的 一 些 常 见 距 离 度 量 方法 。 男 
外 0.3.3 小 节 还 将 简单 介绍 儿 种 基本 的 图 像 操 作 。 


0.3.1 ”邻接 性 、 连 通 性 、 区 域 和 边界 
为 理解 这 些 概念 ， 需 要 首先 了 解 相 邻 像 际 的 概 


仿 。 依 据 标准 的 不 同 ， 可 以 天 注 像 系 P 的 4 邻 域 和 8 
邻 域 ， 吉 图 0.8 所 示 。 





(b) P 的 8 领域 V。(P) (c) P 的 对 角 领 域 Np СР) 
图 0.8 P 的 各 种 邻 域 
1. 邻接 性 (Adjacency) 


定义 V 是 用 于 决定 邻接 性 的 灰 度 值 集合 ， 它 走 
一 种 相似 性 的 度量 ， 用 于 确定 所 需 判 断 邻 接 性 的 像 
系 之 间 的 相似 程度 。 比 如 在 二 值 图 像 中 ， 如 朵 认为 
只 有 有 灰 度 值 为 1 的 像 系 古 相 似 的 ， 则 即 V={1}， 妆 
然 相 似 性 的 规定 上 其 有 主观 标准 ， 因 此 也 可 以 认为 V 
={0，1}， 此 时 邻接 性 完全 由 人 位置 决定 ; ШАГА 
及 图 像 ， 这 个 集合 中 则 很 可 能 包含 更 多 的 元 系 。 此 
外 ， 定 义 对 角 邻 域 Np (P ) 为 8- 邻 域 中 不 属于 4- 邻 域 
ШАЛ СЛ О.8 (с) ) ， 那 么 有 如 下 的 规定 。 


(1) 4% (4-Neighbor) : ШЖ Q EN AA (P 
)， 则 称 具有 V 中 数值 的 两 个 像素 P 和 Q 是 4 邻接 
的 。 


(2) 8 邻接 (8-Neighbor) : WR Q EN g (Р 
)， 则 称 具有 V 中 数值 的 两 个 像素 P 和 Q 是 8 邻接 


Ну. 


举例 来 说 ， 图 0.9 (а) . 09 (b) 分 别 是 像 
АМО. Оу. О» 的 4 邻接 和 8 邻接 示 章 图。 而 对 于 
两 个 图 像 子 集 S MS, WRS у 中 的 某 些 像素 和 3 ， 
中 的 条 些 像 素 相 邻 ， 则 称 这 两 个 子 集 是 邻接 的 。 





(а) 4 邻接 示意 图 (b) 8 邻接 示意 图 


0.9 ”邻接 示意 图 


2. 连通 性 


为 了 定义 像素 的 连通 性 ， 首 移 需要 定义 像素 P 
到 像素 Q 的 通路 (Path) 。 这 也 是 建立 在 邻接 性 的 
基础 上 的 。 


Жр #I жо 的 通路 (Path) 指 的 是 一 个 
FEE BJA У(Х o ‚УО ), (х 1，y 1 ), ees (Xn ‚Уп ), 其 


(хо, уо) = (хр, Ур) (Ха, Уп) = (ха, Уд) FHB 


Ж (x; , yi ) 和 (xi-; , Vi-1 ) 在 满足 1<i <n 时 是 邻接 的 。 
在 上 而 的 定义 中 ，n 是 退路 的 长 上 度 ， 厂 (Xx0,y0)= 
(Xn ;yn )， 则 这 条 过 路 是 闭合 通路 。 相 对 应 于 领 接 
的 概念 ， 在 这 里 有 4 通路 和 8 通路 。 这 个 定义 和 图 论 
中 的 通路 定义 是 基本 相同 的 ， 只 十 由 于 邻接 概念 的 
加 入 而 变 得 更 加 复杂 。 


Їй ХШ) ЛЕШЕ (Contiguous) : 25 代表 一 幅 
图 像 中 的 像素 子 集 ， 如 末 在 5 中 全 部 保 系 之 则 存在 
一 个 通路 ， 则 可 以 称 2 个 像素 P 和 Q ES 中 是 连通 
的 。 此 外 ， 对 于 S RB JEE SP , SPEM ANZ 
И ЩИТЕ 的 连通 分 量 。 如 果 S 中 仅 有 一 


个 连通 分 量 ， 则 集合 S 叫做 和 连通 集 。 
3. 区 域 和 边界 


区 域 的 定义 是 建立 在 连通 集 的 基础 上 的 。 令 R 
ИНАМ РН, HHR 同时 是 连通 集 ， 
ЖЕ 为 一 个 区 域 (Region) 。 


AF (Boundary) 的 概念 是 相对 于 区 域 而 言 
的 。 一 个 区 域 的 边界 (或 边 绿 、 轮 万 ) 是 区 域 中 所 
有 有 有 一 个 或 多 个 不 在 区 域 R rH HJ 24542 ж HJ z< PH 
组 成 的 集合 。 显 然 ， 如 朵 区 域 R ЕЗЕП Ч, ЖУА 
Л] ЭЛЛЕН EJ IIT. В. KITI KE X o- 
而 ， 通 第 情况 下 ， 区 荆 指 一 由 图 像 的 子 集 ， 并 包 丘 


XR. MARZ (Edge) НАЯ: 
于 数 伍 的 像 系 组 成 ， 尽 一 个 像 系 及 其 且 接 邻 域 的 局 
部 性 质 ， 征 一 个 有 大 小 和 方 癌 属性 的 天 量 。 


边界 和 边缘 是 不 同 的 。 边 界 是 和 区 域 有 关 的 全 
WAZ MARR ENR R BH J HE < 


0.3.2 ”距离 度量 的 儿 种 方法 
基于 上 一 人 小节 提 到 的 相关 知识 ， 来 理解 距离 度 
EMER. БТР (Хр , Yp )- Q (ха ‚Уд h К 


(xr ,yr ) 而 言 ， 有 函数 D ўе W ЗАКИ, ИЖ 
数 可 被 称 为 距离 图 数 或 度量 。 


DCP,Q)z0， 当 且 仅 当 P=Q 时 ， 有 D(CP， 
Q)=0 


@D(P,Q)=D(Q,P) 
@D(P,Q)<D(P,R)+D(R,Q) 
第 见 的 几 种 距离 函数 如 下 所 示 。 OKRES 


Рг(Р,6) = ү (тр — Tq Г + {ур — Ид)" 


(0-3) 


即 距 离 等 于 r 的 像素 形成 的 以 P 为 圆心 的 圆 。 
@ Di 距离 (街区 距离 ) 
DP 9) = |£p — т] + [Yp — Yal 
(0-4) 


ВП = rr 的 像 系 形 成 的 以 P уН) 
形 。 


(3) Dg 距离 (棋盘 距离 ) 
Dai P,Q) = max (|z; — Tal » (Yp — Yal) 
(0-5) 


即 距离 等 于 r 的 像素 形成 的 以 P 为 中 心 的 方 
形 。 


距离 度量 参数 可 以 用 于 对 图 像 特征 进行 比较 和 
分 类 或 者 进行 某 些 像 系 级 操作 。 最 常用 的 距离 度量 
是 欧 氏 距离 ， 然 而 在 形态 学 中 ， 也 可 能 使 用 街区 距 
离 和 棋盘 距离 。 


0.3.3 ”基本 的 图 像 操 作 


在 后 续 章 和 中 ， 将 涉及 各 种 各 样 的 图 像 控 作 ， 
这 里 就 几 种 最 为 典型 和 常用 的 图 像 操 作 着 重 说 明 。 
按照 处 理 图 像 的 数量 分 类 ， 可 以 分 为 对 早 幅 图 像 探 
МЕ Сй) 和 对 多 幅 图 像 操 作 (如 求 和 、 求 过 和 和 
逻辑 运算 等 ) ; 按照 参与 操作 的 像素 范围 的 不 同 ， 
可 以 分 为 点 运算 和 邻 域 运算 ; 而 根据 操作 的 数学 性 
质 ， 又 可 以 分 为 线性 操作 和 非 线 性 操作 。 


1. Al PL IC PU 1 r 
НН А | rH АЧ ААА 
同样 的 灰 度 变换 运算 。 设 r 和 s 分 别 是 输入 图 像 f (x ， 
y ) 和 输出 图 像 g (x y EIES (х, yK, M 
KA н] РД H] FE X. 
s= Т(г) 
(0-6) 
MURK а Ја Де, ЯГ rR y `) zu [Н] 
(BEO АНН КЛАР ЈА н, БП Уу 
运算 或 邻 域 滤波 。 这 可 以 使 用 下 式 定 义 。 
g(x,y)=T|f(x,y)| 


(0-7) 


2. 线性 和 非 线性 操作 


令 电 是 一 种 算 子 ， 其 输入 输出 都 是 图 像 。 石 对 
于 任意 两 幅 (或 两 组 ) 图像 F1 和 FF 2 及 任意 两 个 标 
жа Mb 都 有 如 下 关系 成 也 ， 


H (aF 1 +bF 1 )=aH (F 1 )+bH (F 7 ) 
(0-8) 


MIH 为 线性 算 子 。 也 即 对 两 幅 图 像 的 线性 组 
合 应 用 该 算 子 与 分 列 应 用 该 算 子 后 的 图 像 在 进行 同 
样 的 线性 组 合 所 得 到 的 结 来 相同， 也 即 算 子 万 请 在 
线性 性 质 。 同 样 的 ， 不 符合 上 述 定义 的 鼻子 即 为 非 
线性 算 了 于， 对 应 的 征 非 线 性 图 像 操 作 。 举 例 来 襄 ， 
滤波 中 的 平均 平 请、 融 斯 平 消 、 柳 度 锅 化 等 者 古 线 
性 运算 ， 而 中 全 滤波 《〈 详 见 第 5 章 空 间 域 图 像 增 
gh) 则 和 十 非 线 性 的 。 


线性 操作 由 于 其 稳定 性 的 特点 而 在 图 像 处 理 中 
HAIE ERA. 尺 官 非 线 性 算 子弟 第 也 能 够 
皖 贷 较 好 的 性 能 ， 但 它 的 不 可 预测 性 使 其 在 一 些 如 
车 事 图 像 处 理 和 医学 图 像 处 理 等 严格 的 应 用 领 城 中 


难以 获得 广泛 的 应 用 。 


O Ri (Entropy) : Mæl 109 Н ТЕЕ ш 
АМ TRARA] (ЕИ; 
ZZ, МАКАО ЕН, (БАЈЕ А. ВТЕ, 
АА а КАА ЛИЛЕ У, 


第 1 章 “MATLAB 数 字 图 像 处理 编 
程 基础 


MATLAB 是 Mathworks 公 司 开 发 的 一 于 工程 数 
学 计算 软件 。 不 同 于 C++、Java、FORTRAN 等 高 级 
编程 语言 ， 它 们 是 对 机 和 需 行 为 进行 朱 述 ， 而 
MATLAB 是 对 数学 操作 进行 更 百 接 的 摘 述 。 
MATLAB 疼 像 处 理工 具 箱 (Image Processing 
Toolbox，IPT)〉 封 装 了 一 系列 和 针对 不 同 图 像 处 理 需 
求 的 标准 算法 ， 它 们 都 是 通过 直接 或 间接 地 调用 
MATLAB 中 的 和 矩阵 运算 和 数值 运算 函数 来 完成 图 像 
处 理 任 务 的 。 


1.1 MATLAB R2011a 人 简介 


本 节 将 介绍 一 些 MATLAB R2011a 中 与 图 像 处 
理 密切 相关 的 数据 结构 及 基本 操作 ， 如 基本 文件 操 
作 、 变 量 使 用 、 程 序 流 程控 制 、 打 开 和 关闭 图 像 以 
及 图 像 格式 转换 和 存储 方式 等 。 这 些 痢 是 后 续 将 要 
学 习 的 图 像 处 理 算法 的 基础 。 


1.1.1 MATLAB 软 件 环 境 
1. 软件 界面 


图 1.1 所 示 是 运行 于 32-bit Windows 操 作 系 统 上 
的 MATLAB R2011a 堆 网。 软件 主 界 面 由 3 个 子 窗口 
组 成 ， 左 上 为 当前 工作 目录 的 文件 列表 ， 右上 方 为 
当前 工作 区 的 变量 ， 右 下 为 当前 和 最 近 会 话 的 命令 
历史 记录 ， 而 中 间 的 主 窗 口 则 是 命令 输入 和 结果 输 
出 区 ，>> 为 提示 符 。 








š 
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File Edit Debug Paralel Desktop Window Help 
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变量 列表 


命令 窗口 
>> 为 提示 符 























图 1.1 MATLAB 界 面 


2. MATLAB 命 令 与 程序 


可 以 在 >> 提 示人 符 后 面 输入 徐 音 的 算式 〈 例 如 
5*3-2) 或 市 有 六 数 的 算式 《例如 
sin(pi/2)*sqrt(3)/2) 并 回 年 ， 会 握 示 ans=0.8660， 这 
就 是 MATLAB 最 基本 的 计算 功能 。 


这 样 的 输入 形式 实际 上 是 MATLAB 命 令 ， 而 
如 末 在 每 行 命令 的 结尾 答 入 半角 分 号 ， 命 令 窗口 不 
会 立即 显示 命令 执行 的 结果 ， 而 会 将 结果 保存 在 工 


作 区 中 。 例 如 下 面 的 命令 。 





此 时 ， 变 量 res 已 经 存在 于 工作 区 中 ， 但 是 命令 
窗口 不 会 回 显 它 的 值 ， 


为 外 ， 也 可 以 在 文件 采 早 下 执行 “New”-“M- 
Files” 命 令 来 创建 一 个 新 的 MATLAB 文 件 ， 在 里 面 
和 输入 命令 〈 以 半角 分 号 结尾 ) ， 从 而 得 到 一 个 
MATLAB 程 序 。 在 MATLAB 程 序 中 ， 使 用 “%” 表 
示 注 释 ， 其 用 法 和 C/C++ 中 的 /注释 符 类 似 。 


3. SIT ler TJ 


MATLAB 人 允许 在 同一 行 中 输入 多 条 语句 ， 之 间 
用 分 号 隔 开 。 同 时 ，MATLAB 还 允许 将 同一 条 语句 
分 割 在 多 行 中 书写 以 方便 较 长 语句 的 阅读 ， 方 法 是 
在 行 末 使 用 3 个 半角 圆 点 。 例 如 下 和 面 的 语句 。 


>> Z = 2 .* x +exp( x .^ 2 + y .^ 2 - sqrt(1 - log(x) - 
log (y) ) )... 


- y .* sqrt(t) - x .* sqrt(t); 





1.1.2 ”文件 操作 


默认 情况 下 ，MATLAB 可 以 自动 搜索 到 当前 目 
录 (Current Directory) 和 MATLAB 的 路 径 变 量 path 
中 所 含有 目录 下 面 的 文件 。 对 处 在 这 些 位 置 可 由 
MATLAB 执 行 的 文件 ， 直 接 在 命令 窗口 中 输入 文件 
名 即 可 运行 。 如 果 和 需要 和 直接 运行 其 他 目录 下 有 的 文 
件 ， 束 要 使 用 addpath 和 genpath 等 命令 回路 径 列 表 
中 添加 路 径 。 


1. адараёћ р 2% 


Чели 日 定 的 目录 路 径 ， 其 原型 如 


addpath('dir','dir2','dir3' ...'- 





该 图 数 可 以 接受 任意 数目 的 参数 。 
参数 说 明 : 


e dir、dir2、dir3 等 为 要 加 入 的 目录 路 径 ， 这 些 变 
量 必 须 是 绝对 路 径 ; 

。flag 参 数 可 以 用 来 指定 函数 的 行为 ， 可 选 参 
数 ， 其 取 值 的 含义 如 表 1.1 所 示 。 


21.1 адра 2 Fflag 5 87/8 


X Pk р ДЕ МУЛЖ Ж 51] 0 В, AE Hs ih НОЗИР ЛА ВЈ 
同名 文件 被 找到 从 而 执行 。 这 往往 用 于 需要 修改 系统 茶 一 命令 行为 的 场合 








者 ”| 这 毕 路 笃 将 位 洪 加 到 搜索 列表 的 最 后 面 ， 原 列表 中 的 同名 文件 将 先 于 这 些 目 录 中 合 
有 的 文件 被 找到 从 而 执行 。 这 样 可 以 避免 用 户 M 文 件 履 兰 系 统 M 文 件 的 功能 


end 





与 0 或 begin 相 同 


可 以 在 使 用 addpath 函 数 表 后 查看 path 变 量 的 内 
容 ， 以 确定 洪 加 成 功 。 


2. вепра ži 


ИО Të Н FET f Н 2170717 8, 
其 原型 如 下 。 


p = genpath( ' directory ) ; 


参数 说 明 : 
° 人 参数 directory 为 指定 的 目录 。 


返回 值 : 


-e KZOE ESI E HKE AMEER HKH 
数据 。 返 回 值 也 可 以 下 接 提 供给 addpath， 从 而 
特 接 诬 加 一 个 目录 及 其 全 部 子 目 隶 到 当前 路 径 
列表 中 。 通 过 这 样 的 方式 可 以 方便 地 调用 目 己 
的 程序 工具 箱 ， 例 如 使 用 下 面 的 命令 将 月 
я<“Е:\йосїог research\Matlab WorkVFaceRec”Zs JH 
Ж] 8 24 BJ PA ЖЕЛ, Pk uj РДЕ БЕТИН ЛЛУ 
19211 С.А. ЕасеВес KHEM р У o 


>> addpath(genpath('F:Ndoctor research\Matlab Work\Face 
Rec')) “”% 注 意 这 里 要 使 用 绝对 路 径 





也 可 以 在 运行 M 文 件 时 使 用 完整 的 文件 路 径 ， 
从 而 避免 同名 文件 的 冲突 问题 ， 或 是 从 资源 管理 器 
中 将 M 文 件 拖 动 到 MATLAB 的 命令 窗口 中 直接 运 
行 。 
з. 打开 与 编辑 M 文 件 

如 末 需 要 编辑 某 个 M 文 件 ， 可 以 使 用 open 命 令 
和 edit 命 令 ， 它 们 的 调用 形式 如 下 。 


open filename 
edit filename 


参数 filename 为 需要 打开 的 文件 名 。edit 命 令 只 
能 编辑 M 文 件 ， 而 open 命 令 可 以 使 用 Windows 于 认 
操作 打开 一 系列 其 他 类 型 的 文件 。 


1.1.3 在线 帮助 的 使 用 


在 MATLAB 中 ， 有 以 下 4 种 方法 获取 软件 的 在 
线 帮助 。 
1. help 命 令 


help 命 令 可 以 用 于 查看 MATLAB 系 统 或 M 文 件 
中 内 置 的 在 线 帮助 信息 。 命 令 格式 如 下 。 


help command-name 


command-name 为 需要 查看 在 线 帮 助 的 命令 或 
函数 的 名 称 。 例 如 ， 想 要 查看 doc 命 令 的 使 用 方 
法 ， 可 在 命令 提示 符 下 直接 输入 “help doc”, wK 
1.2 所 示 。 


>> help дос 


DOC Reference page in Help browser. 


ПОС opens the Help browser, 1Ё 11 is not already running, and 


otherwise brings the Help browser to the top. 


DOC FUNCITIONNAME displays the reference page for FUNCITIONNAME in 
the Help browser. FUNCITIONNAME can be a function or block in an 
installed MathWorks product. 


DOC МЕІНОГНАМЕ displays the reference page for the method 
МЕТНОГНАМЕ. You may need to run DOC CLASSNAME and use links on the 
CLASSNAME reference page to view the MEIHODNAME reference page. 


DOC CLASSNAME displays the reference page for the class CLASSNAME. 
You may need to qualify CLASSNAME by including its package: DOC 
FACKAGENAME. CLASSNAME. 


DOC CLASSNAME. METHODNAME displays the reference page for the method 
МЕТНОГНАМЕ in the class CLAS5NAME. You may need to qualify 
CLASSNAME by including its package: DOC FACKAGENAME. CLASSNAME. 


DOC РЕОГОСТІОСІВОХНАМЕ displays the documentation roadmap page for 
FRODUCITTOOLBOXNAME in the Help browser. FRODUCITOOLBOXNAME is the 
folder name for a product in matlabroot/toolbox. Io get 
PFRODUCTIOOLBOKENANME for a product, run WHICH FUNCTIONNANME, where 
FUNCIIONNAME is the name of a function in that product; MATLAB 
returns the full path to FUNCIIONNANME, and FRODUCITOOLBOXNAME is 
the folder following matlabroot/toolbox/. 


41.2 help 命令 界面 
2. doc 全 今 
doc 命 令 可 以 用 于 查看 命令 或 函数 的 HTML 玫 


助 ， 这 种 帮助 信息 可 以 在 帮助 浏览 器 窗口 中 打开 。 
其 调用 格式 如 下 。 


doc function-name 





doc 命 令 可 提供 比 help 命 令 更 多 的 信息 ， 还 可 能 
包含 图 所 或 视频 等 的 多 媒体 例子 ， 对 图 像 处 理工 具 
箱 中 的 函数 更 是 如 此 。 


图 1.3 所 示 为 在 命令 行 中 输入 doc imhist 命 令 后 
киели. 


File Edit Мем Go Favorites Desktop Window Help 


Pam: D + à = = Ñt- fx < Pixel Values and Statistics k imhist 


IH uL IE DESE l LY ТЕКТЕ Oria BF s чек чеш к Cam rL a ш, Lireo, LLL eL, 


їчтє Е, uint32, int32, single, double, Of logical. An input 
ЕР ун Е: indexed image сап be of class uint8, uintié, single, double, 
2-6 Image Processing Toolbox ; 
: EÈ Getting Started Or logical. 


i < User's aa Examples 


H- тавана MA and Exploratio 


imread {'pout.tif'); 
H- GUI Tools 


| imhist(I) 
EE-Spatial Transformation апа н 


= asas Analysis and Statistics 


一 
一 
一 


由 Image Analysis 


x : 由 Texture Analysis и | 
: : = Pixel Values а езе 
1 x ЖК impixel - Piee! colos || 800] 
u fx Improfi в Pix I-val 
[ | Jx mean2 - Average о 
; Jx cgionprop - Мег 
: -fx std2 - Standard del 
96 Кайа. 


由 Image Enhancement апа Resi 


: 由 -Linear Filtering and Transforn 


а 4 





41.3 doc 命令 结果 


3. lookfor 命 今 


己 命 令 或 图 数 的 完整 拼写 时 ， 可 以 使 用 
jookfor 命 命令 SERGE НН ARRIR РУНА 
字 中 舍 有 有 所 但 内 容 的 函数 或 命令 。 其 调用 格式 如 
F, 


lookfor keyword 


keyword 为 指定 要 但 找 的 关键 字 。 此 命令 可 以 
给 出 一 个 包含 指定 字符 串 的 水 数列 表 ， 其 中 的 函数 
名 称 为 超 链 接 ， 点 击 即 可 但 看 该 了 水 数 的 在 线 儿 助 ， 
如 图 1.4 所 示 。 


>> lookfor sin 


tscollection — Create a tscollection object using time or time series objects. 
BioIndexedFile — class allows random read access to text files using an index fil 
cgslblock - Constructor for calibration Generation Simulink block parsing ma 








xregaxesinpu — Constructor for the axes input object for a ListCtr1 


Exhaustive5eg 
KDIreeSearche 


—- Nearest neighbor search object using exhaustive search. 


— Nearest neighbor search object using a kd-tree. 















lsmcc — tests if the code is running during compilation process (using M 
java - Using Java from within MATLAB. 

syntax — You can enter MATLAB commands using either a FUNCIION format or 
subsindex 成 击 超 链 接 —- Subscript index. 

bsxfun aAA Ж - Binary Singleton Expansion Function 

isinf 的 在 线 帮 助 — Irue for infinite elements. 

squeeze —- Remove singleton dimensions. 

acos - Inverse cosine, result in radians. 

acosd - Inverse cosine, result in degrees. 

acosh -~ Inverse hyperbolic cosine. 

asin - Inverse sine, result in radians. 

asind - Inverse sine, result in degrees. 

asinh - Inverse hyperbolic sine. 

cos — Cosine of argument in radians. 

cosd — Cosine of argument in degrees. 

cosh - Hyperbolic cosine. 

sin — Sine of argument in radians. 

sind — Sine of argument in degrees. 

sinh - Hyperbolic sine. 

gsvd — Generalized Singular Value Decomposition. 

svd — Singular value decomposition. 

detrend —- Remove a linear trend from a vector, usually for FFI processing. 
interoft - 1-р interpolation using FFI method. 


41.4 lookform 78] 
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在 MATLAB R2011a 的 主 界面 中 按键 盘 
的 “F12 键 ， 弹 出 如 多 1.5 所 示 的 对 话 框 。 





Фе Ф Ç > й 


MATLAB 








Functions: Handle Graphics: 
и Ву Categor а Object Properties 





ш АІрһабеїї1саі List 





What's New 


= MATLAB Release Notes 
summarizes new features, buz fixes, upgrade 1LSSUES， 


etc. 


III | F 





Fl to toggle focus; Escape to close 





图 1.5”F1 命 令 界 面 


单 击 左下 角 的 “Open Help Browser” 链 接 打 开 如 
图 1.6 所 示 的 帮助 浏览 颖 窗口 。 在 左上 角 的 编辑 框 中 
输入 感 兴趣 的 天 键 字 ， 单 击 回 和 车 进行 查询， 右 侧 会 
出 现 相 应 的 帮助 信息 。 


在 后 面 的 章 Р, ИШ куи, / SAREMA 
Н М, АНОН 过 在 线 帮 助 寻 求 相 天 信息 ， 以 
此 增强 日 学 能 










maketform| 


Contents | Search Results 





ФШ  - 


二 个 Aerospace Toolbox 
+ @ Bioinformatics Toolbox 
1- Code Generation from MATLAB 
8.6 Communications System Toolbo: 
+- Computer Vision System Toolbo 
+ @ Control System Toolbox 
+-@@ Curve Fitting Toolbox 
+ Data Acquisition Toolbox 
由 -个 Database Toolbox 
+ @ Datafeed Toolbox 
+) -@ DSP System Toolbox 
+-@@ Econometrics Toolbox 
= .@ EDA Simulator Link 
+-Ф Embedded Coder 
#.@ Filter Design HDL Coder 
= -@ Financial Toolbox 
+ -@8 Financial Derivatives Toolbox 
四 各 Fixed-Income Toolbox 
+ @ Fixed-Point Toolbox 
+ 2 Fuzzy Logic Toolbox 
+ @ Global Optimization Toolbox 
由 个 Image Acquisition Toolbox 
= 82 Image Processing Toolbox 

H- > Getting Started 

由 -< User's Guide 

=. fx Functions 

#-1таде Display and Exploratio 
站 -GUI Tools 
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esktop Window Help x 
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Handle Graphics: 
a Object Properties 


Functions: 


a By Category 
а Alphabetical List 





What’ s New 


m 


= HATLAB Release Notes 
Summarizes new features, bug fixes, upgrade issues, etc. 
= General Release Notes for R2011a 
For all products, highlights new features, 
compatibility issues 


installation notes, bug fixes, and 


Documentation Set 


> Getting Started 


» User Guides 


= Getting Help 
Provides instructions for using help functions, 


resources 


the Help browser, and other 


a Examples in Documentation 
Lists major examples in the MATLAB documentation 


a Programming Tips 
Provides helpful techniques and shortcuts for programming in MATLAB 
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1.1.4 变量 的 使 用 
= РЧ 


Дн Н] Д1 ТАЈ ЖАШ ИВ EA Pl, 
MATLAB 中 变量 的 命名 规则 和 C/C++ 等 第 见 的 编程 
语言 很 类 似 ， 同 时 也 对 大 小 写 是 敏感 的 。 男 外 ， 
MATLAB 中 的 变量 不 需要 先行 定义 ， 但 在 使 用 前 一 
定 要 赋值 。 


1. 变量 的 赋值 


HJ PBB phi Bi ЈАР АИА. IME Pe Es 
用 等 亏 “=”， 例 如 a=5 是 给 a〈 注 意 不 是 A) ANTE 
IWAS, WRR EXN TEA, SHIJEN. 在 
MATLAB, Жж 定义 时 不 需要 显 式 地 指明 类 型 
Matlab 会 根据 等 号 右边 的 值 目 动 确定 变量 的 类 型 。 
路 认 的 对 数字 的 存储 类 型 为 double 型 或 double 型 数 
组 ， 而 字符 的 存储 类 型 为 char 型 ， 字 符 串 的 存储 次 
型 为 char 型 数组 。 


对 字符 串 赋 信 时 ， 需 要 用 半角 单 引 亏 “ ”后 起 来 


(注意 不 古 双 引 写 ， 也 不 是 任何 的 全 角 字 从 〉， 例 
xmsg='Hello world'。 


2. 内 部 变量 


MATLAB 有 过 些 内 部 变量 名 和 体 留 字 ， 如 表 
1.2 所 示 。 变 量 命 名 时 不 要 与 它们 重 名 。 


表 1.2 MATLAB 内 部 变量 列表 


特殊 变量 


默认 的 结果 输出 变量 








ЇЙЇ) 单位 虚数 值 





| 


i 





з. 全 看 工作 区 中 的 变量 


使 用 who 和 whos 命 令 可 以 但 看 所 有 当地 工作 区 
中 变量 的 情况 。 使 用 clear 或 clear all 命 令 可 以 清除 工 
作 区 中 所 有 的 究 量 定义 ， 也 可 以 在 clear 后 面 加 上 区 
量 名 ， 清 除 特 定 有 的 变量 定义 。 男 外 ，clc 命 令 可 以 用 
来 清 屏 ， 所 以 这 两 个 命令 利 弟 用 在 M 文 件 的 开头 用 


Жж АРН L AEDP 


>> a = 1; % 定 义 一 个 数值 型 变量 a 
>> str = 'hello'; % 和 定义 一 个 字符 串 变 量 (字符 数组 ) 


>> v = [3 2 1] % 定 义 一 个 数值 型 问 量 


>> whos 
Name Bytes Class Attributes 
8 double 
10 char 
24 double 


>> clear all 
>> whos 
>> 





4. 数据 类 型 及 其 转换 
MATLAB 中 的 数据 类 型 列表 如 表 1.3 所 未 。 


表 1.3 MATLAB 数 据 类 型 


MATLAB 中 最 币 见 也 是 玖 认 的 数据 类 型 ， 双 精度 方式 存储 的 浮 点 数 。 有 效 范围 
是 -10308 到 10393 。 这 同时 也 是 MATLAB 所 能 直接 给 出 的 最 大 数值 范围 。 此 种 类 型 
占用 的 内 存 空间 为 8 字 节 





uint8 | 8 位 无 符号 整数 ， 范 围 是 0 到 255。 此 种 类 型 占用 的 内 存 空 间 为 1 字 节 

16 位 无 符号 整数 ， 范 围 是 0 到 65 535。 此 种 类 型 占用 的 内 存 空 间 为 2 字 节 

32 位 无 符号 整数 ， 范 围 是 0 到 4 294 967 295。 此 种 类 型 占用 的 内 存 空间 为 4 字 节 

_ 范围 是 0 到 18 446 744 073 709 551 615。 此 种 类 型 占用 的 内 存 空 


8 位 有 符号 整数 ， 范 围 是 -128 到 127。 此 种 类 型 占用 的 内 存 空间 为 1 字 节 


16 位 有 符号 整数 ， 范 围 是 -32 768 到 32 767。 此 种 类 型 占用 的 内 存 空间 为 2 字 节 


32 位 有 符号 整数 ， 范 围 是 -2 147 483 648 到 2 147 483 647。 此 种 类 型 占用 的 内 存 空间 
jJ pP i 


64 位 有 符号 整数 ， 范 围 是 -9 223 372 036 854 775 808 到 9 223 372 036 854 775 807. 
此 种 类 型 占用 的 内 存 空 间 为 8 字 节 





变量， 占用 空间 为 2 字 节 





布尔 型 变量 ， 占 用 空间 为 1 字 节 。 此 种 类 型 的 转换 函数 也 可 以 使 用 boolean， 与 


logical 等 效 





驮 认 情 况 下 ，MATLAB 将 变量 存储 为 双 精 度 浮 
点 数 (double) ， 而 MATLAB 中 的 很 多 函数 也 只 接 
受 这 种 类 型 的 数据 。 然 而 ， 图 像 处 理 操 作 中 经 沿 使 
用 到 uint8 等 类 型 的 数据 ， 这 就 需要 执行 数据 类 型 的 
强制 转换 操作 。 这 种 操作 很 简单 ， 调 用 格式 统一 如 
Fe 


Destination Маг = type пате(Ѕоигсе Var) 


其 中 ，type_name 即 数据 的 存储 类 型 ， 
Destination Var 和 Source Var 分 别 为 目标 变量 和 原 
始 和 这 量 。 例 如 下 面 的 命令 将 double 原 始 变 量 a 转换 
JJuint84 =b 。 


> a= 1; 
>> b = uint8(a); 


5. 读 取 与 你 存 工作 区 中 的 变量 


save 命 令 可 以 将 当前 工作 区 的 变量 以 二 进 制 的 
方式 保存 到 扩展 名 为 MAT 的 文件 中 ; load 命 令 可 以 
谈 出 这 标的 文件 。 它 们 的 调用 格式 如 下 。 


save filename argl arg2 arg3, ... 
load filename агр1 arg2 arg3, .. 


。filename 参 数 指定 保存 或 读 取 变量 所 使 用 的 文件 
名 。 如 果 不 指 定 文件 名 ， 默 认 使 用 的 文件 是 
matlab.mat。 

。argl、arg2、arg9 等 参数 是 需要 从 文件 中 存储 或 
该 出 的 变量 名 。 这 两 个 命令 分 别 可 以 存储 或 庶 


取 一 个 或 一 组 变量 。 


下 面 的 命令 将 price、age 和 number 三 个 要 量 保 
存 到 文件 MyData.mat 中 。 


>> Save( 'MyData.mat', 'price', 'аре', 'number') 


也 可 以 不 指定 变量 名 ， 从 而 将 当前 工作 区 中 所 有 的 变量 一 起 储存 
到 mat 文 件 或 将 文件 中 保存 的 所 有 变量 一 起 谈 入 工作 区 ， 这 个 批量 你 存 
和 读 取 功能 在 运行 非常 耗 时 的 程序 时 显得 十 分 有 用 一 一 由 于 MATLAB 
执行 效率 并 不 高 《和 Visual C++ 相 比 ) ， 所 以 对 于 一 个 计算 量 很 大 的 程 
序 而 言 ， 运 行 几 个 小 时 并 不 稀奇 。 这 时 ， 可 以 根据 需要 在 希望 中 断 程 
序 时 保存 程序 的 所 有 上 下 文 变 量 ， 以 备 之 后 随时 从 中 断 点 开始 执行 。 


1.1.5 ЕВУ Н 

1. SEREHE X 
ÆMATLABF же ХЖ 18 1 В. n NEH EH 

275710817517, НУ (ARATIR) 分 隔 

列 与 列 来 直接 定义 窍 阵 ， 比 如 下 面 的 命令 就 定义 了 

一 个 3 行 3 列 的 二 维 窍 阵 A 。 





A=[ 1， 2a 1855 as © Zy Ө, 9] 
A = 


1 2 3 
4 5 6 


还 有 有 为 一 种 方式 可 以 生成 行 问 量 ， 
[begin:inc:end] 会 生成 从 begin 开 始 到 end 缮 束 ， 增 量 
为 incre 的 一 系列 数字 组 成 的 同 量 。 如 v=[2:1:10] 表 示 
生成 从 2 到 10 的 同 隐 为 1 的 同 量 (一 维 趣 隆 )， 妈 : 





如 果 间 隔 为 1， 也 可 以 忽略 中 间 的 参数 ， 直 接 
输入 T=[2:10] 即 可 。 


2. БАКРИ RF 


Але МУК, aJ RIT A Е KHF E НУ 
了 车， 比如 eye(n ) 生 成 N 阶 单位 阵 ，zeros(n ) 生 成 N 阶 
每 个 元 系 均 为 0 的 方 阵 ，magic(n ) 生 成 N 阶 么 J 方 阵 
每。 种 见 的 用 于 生成 窍 阵 的 函数 列表 如 表 1.4 所 示 。 


表 1.4 生成 矩阵 的 函数 


pq ЖИК Н ж 











Zeros 产生 全 部 元 素 为 0 的 矩阵 


true лж УННН Е 
ЕЗУ 5] АВЕ: 

= ТЕЗА BB LA pE 

产生 随机 排列 
产生 线性 等 分 的 矩阵 

产生 伴随 矩阵 








З. АЗН Е ХАНАЕВ 


ілер Жн] РМА ЕН ERIR, 


АКАИ HJ EEA i ДЕ ARIS КӨ ТЖ НОТ 25 
等 。 其 调用 方法 如 下 。 


。 人 A 为 需要 合 看 大 小 的 数组 ; 

° dim 为 指定 的 要 但 看 的 维 数 ， 这 是 一 个 可 选 参 
数 ， 石 个 指定 此 参数 ， 人 返回 值 为 一 个 包含 数组 
从 第 一 维 到 最 后 一 维 大 小 的 数组 。 


例如 ， 对 于 一 个 3 行 5 列 的 窍 隆 B， 有 size(B， 
1)=3, size(B,2)=5, size(B) = [3 5]. 


图 数 ndims 可 РД AA ZHE. JHA НП 
| 


其 中 A 为 需要 查看 维 数 的 数组 。 
4. 访问 矩阵 元 系 
访问 窍 阵 的 一 个 元 素 的 方式 是 在 矩阵 名 字 的 后 


面 注 明 行 列 序 号 ， 例 如 访问 A 的 第 3 行 第 2 列 元 率 惑 
是 A(3,2)。 提 取 和 抢 阵 的 一 整 行 元 素 ， 如 要 提出 A 的 


第 2 行使 用 A(2,)， 如 果 是 第 2 列 则 是 A(,2); MAC) 
表示 将 矩阵 按 列 存储 得 到 一 个 长 列 同 量 。 示 例如 
下 。 


>> A=[1, 2, 3; 4, 5, 6; 7, 8, 9] ; ЕМА 
>> A(1, :) % 提 取 第 1 行 
ans 


2 3 
>> A(:, 3) % 提 取 第 3 列 
ans 





ww 


MATLAB 中 的 矩阵 下 标 是 从 1 开始 的 。 对 图 像 窍 阵 也 是 一 样 ， 所 
以 一 个 m хп 的 窍 阵 实际 的 下 标 范 围 为 [1:m ] 和 [1:n ]。 


ХРА ， 提 取 窍 阵 元 系 或 子 块 的 方法 如 表 
1.5 所 示 。 


21.5 提取 窍 阵 元 系 或 子 块 的 方法 


АШ 





ho 


ACn) 提出 第 n 列 


提出 m 1. т 2 行 ， П 1 Fijn 2 列 的 一 个 子 块 


提出 m 行 到 最 后 一 行 ， 第 n 列 的 一 个 子 块 
将 矩阵 控 列 存储 得 到 一 个 长 列 问 量 


进行 是 阵 运算 


可 以 像 对 数字 操作 一 样 对 窍 阵 进行 操作 ， 旬 页 
算术 运算 符 的 便 用 方法 如 表 1.6 所 示 。 


11.6 ”第 见 的 算术 运算 符 


=E i 
і 





= [Е = и 素 相 乘 。 参 与 运算 的 两 个 矩阵 必须 拥有 同样 
= es. ХЕ РЕН) RE ло BE AT TB ЖЕЗЕКИЕЛ 











EERI |^ |ромег(А,В) 


kE E Ze BR 左 除 A\B 相 当 于 inv(A)*B 
EBEA BR 右 除 A/B 相 当 于 B* inv(A) 
енн ИЕ оа 














E a 
е I О НОНЕ ipu E 


; ЛЕН РЕА Е A S XERRA, MH РСЕ ЕЕ ЇЇ) 
转 置 〈 共 ctranspose(A,B) | 含义 与 普通 转 置 相同 ， 应 用 于 复数 矩阵 时 首先 对 所 有 元 素 
) НЕ >К PETE 8 


МЕ Веда PLK B JU 1 НО AA RKE ЛЯ ЛЯН 
H: АЕ МАИ НЈ, maA 
mo ЕК, вае. WRA S, ЗД 
F HEIA R E o 





FRERE, LA—ZAIJMATLABK Z] L 
进行 专门 针对 图 像 的 像 率 级 操作 。 如 图 像 登 加 
imadd， 图 像 相 减 imsubtract 等 。 


1.1.6 ”细胞 数组 (Cell Array) 和 结构 体 


(Structure ) 


1. 细胞 数组 








ТЕ АКЕ РЁ 05 [HHB JI и ШИИ, ЯУ 
ох) Т у |н] ЖЕЕ ҤЕ EHE [я] Б] — A РЁ 2235 [H| Н 
ñu. [БН], ЖТ ЭЗ НЕТУ РЁ Ж Г) А 2:9 пу НЕ 
少 。MATLAB 提 供 了 允许 这 样 做 的 方式 。 

细胞 数组 是 MATLAB 特 有 的 一 种 数据 结构 ， 它 
的 各 个 元 素 可 以 是 不 同 的 数据 类 型 。 细 胞 数组 可 采 
用 下 标 访 问 。 


例如 ， 一 个 细胞 数组 可 以 采用 如 下 方式 定义 。 


Cell = {'Наггу', 15, [1 ө; 15 2]}; 


也 可 以 通过 {} 加 上 索引 来 直接 定义 细胞 数组 的 
ENA, W FPR. 


% 定 义 细胞 数组 的 另 一 种 方式 
>>Cell {1}= 'Наггу'; 
>>Cell{2}= 15; 


>>Се11{3}= [1 Ө; 15 2]; 





注意 使 用 化 插 志 全 而 不 是 方 括 扎 [来 定义 细胞 
数组 。 对 细胞 数组 的 访问 方式 也 很 简单 ， 同 伞 使 用 
13654 25 518. 


| % 访 问 细胞 数组 | 


>> Се11{1} 
ans = 
Наггу 
>> Се11{2} 
ans = 

15 
>> Се11{3} 
ans = 





MEHRA = Л# А) ж 5] АЈ ЈА ar HJ i 
述 ， 如 下 所 示 。 


>> Cell(3) 
ans = 


[2х2 double] 





УУ. к. 
注意 


细胞 数组 中 存储 的 是 建立 该 对 象 时 所 使 用 的 其 他 对 象 〈 和 矩阵 或 字 
ФВ. QC SF) 的 复制 而 不 是 引用 或 指针 ， 即 使 其 他 对 象 的 人 被 改 
变 ， 细 胞 数组 中 的 信也 不 变 。 


2. 结构 体 
结构 体 是 另 一 种 形式 的 聚合 类 型 ， 它 与 


C/C++ 中 的 结构 体 或 类 很 相似 ， 拥 有 多 个 不 同类 型 
НВ, ЖЯ as PL HARTZE, Ez P, 


须 具 有 独特 的 名 字 以 便 区 分 。 访 问 结 构 体 的 方式 与 
定义 的 方式 相同 。 上 面 的 例子 如 果 用 结构 体 表 示 ， 
则 如 下 所 示 。 


% 定义 结构 体 
Struct.Name = 'Harry'; 
Struct.Age = 15; 
Struct.SalaryMatrix = [1 0; 15 2]; 
>> 
>> Struct % 显 示 结 构 体 的 内 容 
Struct = 
Мате: 'Harry' 
Age: 15 
SalaryMatrix: [2x2 double] 


>> 
% 访问 结构 体 的 内 部 字段 
>>name = Struct .Name ; 





而 访问 结构 体内 容 时 ， 使 用 相同 的 语法 即 可 ， 
例如 Struct.Name 的 人 仍然 是 “Harry”。 


IX РАЛЫ О R E ТЕЛКИ Г ИЙ ЛАЛ Н 
Simulink H4 rH НУ JÜ ZJ? H < 


1.1.7 ХАЈН EJ НА Pt 


关系 运算 符 的 运算 结果 是 布尔 量 (0 或 1) ， 具 
体 说 明 如 表 1.7 所 示 ， 


R17 ”关系 运算 符 的 使 用 





MATLABIE XF )а 3, 常见 的 逻辑 运算 
符 如 表 1.8 所 示 。 





1.1.8 利用 图 像 处 理 数学 函数 


MATLAB 最 为 强大 的 功能 是 依靠 图 数 实 现 的 ， 


这 些 函 数 可 能 是 MATLAB 内 置 的 ， 也 可 能 是 由 M 文 
IFTE. m ILAJA sin coss tan, log, log2ix}¥ 
УИН РА RitraceX PE АЧ Ер, MA ТЕҢ RN 
“е ЗЕРТ ГЕРА ЖЛЕ И АРА ЕН w H3⁄: Z , 
1.97 ЛЖ ЕЕ Жн» HHJ HA РЁ Хх ЕН 
数 蝎 评 细 的 用 法 搬 述 ， 可 以 退 过 help 或 open 命 令 獒 


得 。 


表 1.9 ”种 用 的 馆 辑 函数 和 十 阵 函数 


i Ë оаа 
all ER TAIF 








де (TN yE E H ЇН] 





— 


isreal 判断 是 否 实 和 矩阵 


返回 一 个 由 非 零 元 素 下 标 组 成 的 窍 阵 
ШТ 








diag ШБМ 2470 ж 


е1 


go 


in 


一 


rank ЖЕ ЕА 


e. 
д 
并 
m: 
Ş 
5 


SV 


Tnu 抽取 下 三 角 阵 


调用 MATLAB 函 数 的 方法 为 : 函数 名 后 使 用 一 








对 圆 括 号 括 住 提供 给 函数 的 参数 ， 如 Sin(D。 如 果 函 
数 有 返回 值 ， 但 调用 者 没有 指 冠 接 收 返 回 值 的 变 
量 ， 系 统 会 使 用 默认 的 ans 变 量 存 储 返 回 值 。 如 果 
函数 返回 多 个 值 ， 则 ans 中 只 保留 第 一 个 返回 值 ， 
因此 对 于 这 种 情况 应 显 式 地 使 用 向 量 来 接收 返回 
值 ， 如 下 所 示 。 





使 用 函数 还 应 当 注 意 以 下 儿 扩 。 


(1) 函数 只 能 出 现在 等 式 的 右边 。 

(2) 每 个 函数 依 原型 不 同 ， 对 目 变 量 的 个 数 
和 类 型 有 一 定 的 要 求 ， 如 sin 和 sind 孙 数 。 

(3) 函数 允许 按照 规则 航 套 ， 比 如 
sin(acos(0.5))。 
1.1.9 MATLAB 程 序 流程 控制 


MATLABIE J FETJE LITEREN, E 
们 的 用 法 和 C/C++ 中 几乎 完全 一 致 ， 如 表 1.10 所 
示 。 


表 1.10 程序 流程 控制 方法 


if expression1 






statements1 
вй. шее осш 如 果 elseif 使 用 的 层次 较 多 ， 可 以 考虑 转 而 使 用 
else аце switch 


else expression3 
statements3 
end 


for 
for index=start:increment:end | increment 指 定 步 进 值 ， 省 略 则 默认 为 1。 可 以 租 套 
statements 使 用 
end 


while expression 


statements [J n] Д 9 Ж{# HI 


while 
end 


аланов 
изаа Еми 


switch expression 
case expression1 





statements1 
Ti case expression2 没有 默认 的 fall-through， 因 而 不 需要 使 用 配套 的 
i. statements2 breake к] 


otherwise 
statements other 
end 





return 


1. ТӨЗ 


在 后 面 ， 将 多 次 使 用 这 些 语句 ， 因 而 ， 在 此 给 

Н ЛАХТА В НУУ ы Ей АЈДЕ EIZ 

(http://bbs.book95.com) Н“ 9 9 5656" 9: 
与 本 书 同 名 的 主题 帖子 附件 中 的 chapter1/code Н ж 
下 找到 示例 1.1 一 示例 1.3 所 对 应 的 M 文 件 ， 也 可 以 
通过 菜单 “File”-,“New”-,“M-Files” 新 建 一 个 M 文 
件 ， 在 出 现 的 窗口 中 粘贴 这 些 代 人 码 ， 然 后 运行 。 在 
非 注释 行 处 按 下 F12 可 以 设置 和 新 点 ， 按 下 F5 键 可 以 
运行 程序 。 


【 例 1.1】 ЕЈ ОЕ X, НН, 


%ex1 1.m 


аге=іприї ( "Input argument:'); % ух) Маге? 
total = 0; detail = 0; 
% ji 语句 开始 
if(arg==1) 
% 外 层 for 语 句 开始 
for i=1:1:5 
total = total + 1; 
% 内 层 for 语 句 开 始 
for j=1:0.1:2 
detail = detail + total; 
% 内 层 for 语 句 结束 
end 
% 外 层 for 语 句 结 
end 
% jj 语句 的 另 一 分 文 
elseif (arg==2 ) 
total = 0; 


detail = total; 
% if 语句 的 其 他 所 有 分 文 


else 

error('Invalid arguments!'); 
%if 语 句 结束 
end 


detail % 显示 detail1 变 量 





请 注意 本 例 中 分 号 的 使 用 。 


【 例 1.2】 与 例 1.1 类 似 的 功能 ， 使 用 Switch 分 
支 和 while 循 环 。 


%ex1 2.m 


arg=input('Input argument: ' ); 
total = 0; detail = ө; 
% switch 语 句 开 始 
switch arg 
% 分 文 1 


case 1 


1=1; 
% 外 层 whilei тн) АВ 
while (1<=5) 
total = total + 1; 
i = i + 1; 
j = 1; 
% 内 层 while 语 句 开 始 
while (j<=2); 
ri detail + total; 
= J + 0.1; 
% не 7 


end 
% 外 层 while 语 句 结束 
end 
2% 2 
case 2 
total = 0; 
detail = total; 
% 分 文 其 他 
case others 
error('Invalid arguments'); 
% switch 语 句 结 
end 
detail 


总 结 这 两 个 例子 ， 可 以 有 发现 ， 在 分 文 较 多 时 使 
用 Switch 是 合 算 的 ， 而 for 和 while 用 于 循环 控制 ， 这 
一 点 与 C/C++ 是 完全 相同 的 。 但 是 ， 相 对 于 
C/C++，MATLAB 有 一 个 突出 的 优点 ， 束 是 可 以 目 
动 生 成 元 又 之 间 有 具有 特定 间隔 的 和 矩阵， 从 而 避免 使 
用 地 些 循环 ， 这 里 仅仅 使 用 二 维 的 情况 举例 。 


【 例 1.3】 产生 一 幅 亮 度 按 对 角 线 方向 的 余弦 
规律 变化 的 灰 度 图 ， 比 较 一 维 方法 和 二 维 方法 所 需 
的 时 间 。 





A 
+ 


rand(3000, 3000); 
zeros(3000, 3000); 
иб = 100; vð = 100; 


tic; % 开始 计时 


% 一 维 方法 
% 外 层 for 循 环 开始 
for r=1:3000 
uðx=u0*(r-1); 
% 内 层 for 循 环 开始 
for c=1:3000 
voy=v0*(c-1); 
f(r,c) = A(r,c) * cos(u@x+v0y); 
% 内 层 for 循 环 结束 
end 
% 外 层 for 循 环 结束 
end 


t1=toc % 停止 计时 并 记录 时 间 到 t1 
tic; % 重新 开始 计时 


% 二 维 方法 
r = 0:3000-1; 
c = 0:3000-1; 


[C, R] = meshgrid(c, r); 

% meshgrid 是 生成 网 格 坐 标的 函数 ， 实 际 束 是 生成 需要 的 二 维 像 系 点 
的 坐标 拟 合 表示 

% 建议 谈 关 在 这 里 中 断 ， 观 察 一 下 C 和 R 窍 阵 的 内 容 。 


g = A .* cos(uð .* R + v0 .* C); 
% 系 统 将 目 动 执 行 “循环 ”操作 ， 实 质 是 对 R 和 C 中 每 个 数据 按照 指定 公 
式 操 作 


t2 = toc % 停止 计时 并 将 计时 值 保存 到 t2 


在 运行 之 后 ， 结 果 发 现 ，t2 远 小 于 t1。 因 此 ， 
在 用 MATLAB 对 数字 图 像 按 像 系 进 行 操作 时 ， 需 要 
尽 可 能 地 人 避免 使 用 条 拙 的 多 层 骸 侄 循 环 。 


2. meshgrid() rK ži 

例 1.3 中 用 到 的 meshgridO0 函 数 用 于 根据 给 定 的 
村 纵 坐 标点 生成 坐标 网 格 ， 以 便 计 算 二 元 函数 的 取 
信 ， 在 绘制 三 维 曲 面 时 常常 会 用 到 它 。 其 调用 方式 
如 下 。 


[X,Y] = meshgrid(x, y) 


参数 说 明 : 


° x 为 输入 的 模 坐 标 ; 
° у 为 输入 的 纵 坐 标 。 


返回 值 : 
° X 和 了 У Ж ЁЁ дА НУВ ЧАРА ЕЛП АЕ 
ВЕ, ХЕТ ВЕНУ я IA AIAT БУЛУ E SA HJ 88 A 
标 和 纵 坐 标 。 


下 面 以 绘制 二 维 融 斯 函数 曲面 为 例 说 明 
meshgrid 的 用 法 。 


中 心 在 原 后 的 三 维 蜗 斯 函数 表达 式 为 : 


Hu. u] = e [Чч +u" |26 


下 面 的 程序 分 别 为 u 和 v ЙАН [-10:0.1:10], <o 
=3， 使 用 meshgrid 函 数 生 成 网 格 ， 并 计算 函数 值 ， 
(注意 这 里 使 用 的 是 .人 ^ 和 ./， 而 不 是 ^ 和 /， 因 为 计 
TI REER) ， 然 后 再 使 用 mesh 函 数 
将 其 显示 到 绘图 窗口 中 。 


U [-10:0.1:10 |; 

V [-10:0.1:10 |; 

[U,V] = меѕһћегіа(и, м); 

Н = ехр(-(0.^2 + №.^2)./2/3^2); 

теѕћ(и, v, Н); 

% meshý 7 2211] 2 IIB РЕМ, 56 АТВ А2907 Ax 


轴 和 y 


轴 的 坐标 后 序 列 ， 第 三 个 参数 为 在 由 坐标 点 序列 确定 的 每 一 个 方 格 后 
上 的 函数 但 





生成 的 图 像 如 图 1.7 所 示 。 


2р6 каше 


ЯЕ Я AA PAASA E, 
а i: . J Жр 2 
`L Кү I 1 “4 
. “PY п? А, Р, * +, ЫЯ ИГ 
о Ж aa 





优化 小 技巧 : 提前 分 配 窍 阵 内 人 存 


这 个 技巧 与 动态 内 存 的 使 用 有 
大。 在 C/C++ 里 ， 使 用 大 块 动态 内 和 存 
往往 意味 看 堆 操 作 ， 而 当 分 配 的 动态 


内 存 零 散 无 序 时 ， 会 产生 大 量 内 存储 
户 ， 进 而 导致 内 存 分 配 和 回收 效 对 降 
低 。 所 以 ， 可 以 事先 分 配 一 块 足 够 大 
的 空间 (当然 ， 不 是 过 大 ) 以 尽量 减 
少 内 存 健 厂 的 产生 。 事 实 上 ， 
MATLAB 中 分 配 动态 内 存 远 没有 
C/C++ 那样 碎 烦 ， 只 需要 类 似 如 下 一 
a 


memo = zeros(1024, 128); 


这 条 语句 本 来 是 用 于 构造 一 个 元 
系 全 部 为 零 的 宅 阵 ， 但 同时 很 目 然 地 
ШЙ Ир У Веле 0 НЧ [Н] 


1.1.10 МУ EJ 


M 文 件 和 C/C++ 中 ccpp 文 件 类 似 ， 就 是 存储 
MATLAB 代 但 并 可 以 执行 的 文件 。MATLAB 的 汤 
代码 文件 可 以 直接 执行 而 不 需 编 详 〈 也 可 以 通过 编 
译 来 使 代码 运行 得 更 快 ) 。 很 多 情况 下 ，M 文 件 用 
于 封 痛 一 个 功能 函数 从 而 提供 荣 些 特定 功能 。 一 般 
来 说 ，M 文 件 以 文本 格 云 存储 ， 执 行 须 序 从 第 1 行 
开始 同 下 遇 到 终止 语句 结束 ， 用 户 可 以 在 M 文 件 中 
定义 函数 和 过 程 。 


M 文 件 可 以 使 用 任何 文本 编辑 右 编 与 ， 但 最 第 
使 用 的 还 是 MATLAB 目 市 的 M 文 件 编辑 硕 。 如 果 是 
编写 函数 ， 最 好 将 它 放 在 MATLAB 的 搜索 路 径 列 表 
中 的 某 个 目录 下 ， 并 与 系统 目 带 的 M 文 件 分 开 ， 以 
便 管 理 。 

对 于 位 于 当前 工作 目录 中 的 MX 文件 ， 可 以 直接 
在 命令 行 输入 其 文件 名 来 运行 它 。 作 为 图 数 时 ，M 
文件 也 可 以 接受 参数 。 


稍 后 将 提供 一 个 MATLAB 自 带 M 文 件 的 例子 ， 
并 给 予 侧 单 分 析 。 


1.1.11 MATLAB 函 数 编写 


1. KAGE 


MATLAB KZO% ТЕМУ PEX, —— УЙ 
可 以 定义 多 个 函数 。 一 个 MATLAB 函 数 通常 包含 以 
下 组 成 部 分 。 


Ф йе Хіт 


function [outputs] = name(inputs) 


MATLAB 人 允许 返回 多 个 参数 Coutputs) , WR 
只 返回 一 个 参数 ， 可 以 省 略 方 括 号 。 需 要 注意 的 
ШО 例如 ， 如 果 

定义 一 个 用 于 平 清 图 像 的 郴 数 imsmooth， 可 以 将 
OA 


function [imgOut, retCode] = imsmooth(imgIn, args) 


ЯШЕ pK Ж H| ЧЕЛН ШИН 24, ЯД puni ze (F 
и 77385 Я. ЛҮЕН, BES. Te j 
{Н H9 РА 50 та Е XUN F o 


function imsmooth(imgIn, args) 


MATLAB 人 允许 区 分 函数 名 的 前 63 个 字母 ， 多 出 
的 字母 将 们 和 急 略 。 函 数 的 命名 规则 与 C/C++ 类 似 ， 


必须 以 字母 开 兴 ， 可 以 包含 字母 、 数 学 和 下 划 线 ， 
但 不 能 包含 空格 。 


国 数 可 以 在 其 他 的 M 函 数 中 被 调用 ， 也 可 以 在 
MOTAM. HRA EIR, H 
写 出 函数 定义 中 除了 function 之 外 的 部 分 即 可 。 例 
HH: 


[a,b] = imsmooth(I,arg); 


&% “H1” {т 


“НМУ УЕ С А 27 
534817), ЕЛЕНА р E Y T, PA 
ATIT, 200—497 5 BB ВЕ = НТА 
ДИЛЕ. ЈР ЮЙ ТЕЛЕ 9 Һер S ERER 
=j; 而 lookfor 命 令 查 找 H1 行 中 的 指定 天 键 词 ， 并 
在 结果 的 右 侧 列 显示 HI1 行 。 一 个 典型 的 H1 行 的 例 
子 如 下 。 


% IMSMOOTH Perform smooth operation on specified image 
with certain arguments. 


XE, smooth K ŽE lookform S Æ FR AIRT 
会 显示 如 下 。 


IMSMOOTH SMOOTH Perform smooth operation on specified i 
mage with certain arguments. 


Ф EDLA 


帮助 文本 的 位 置 和 约定 同 H1 行 类 似 ， 只 能 案 跟 
H1 行 ， 中 间 不 能 有 任何 空 行 或 者 缩 进 。 同 样 ， 帮 助 
文本 的 本 质 束 是 注释 行 ， 因 而 需要 以 % 开 头 。 

MATLAB 通 过 判断 是 售 当 跟 男 数 定义 来 判断 一 
个 注释 行 完 竟 是 H1 行 、 帮 助 文本 ， 还 是 普通 注释 。 
因此 可 以 在 加 入 一 个 或 多 个 衬 行 后 加 入 普通 注释 ， 
使 用 Help 命 令 将 不 会 显示 普通 注释 的 内 容 。 

Ф ШИЕ 

这 些 部 分 的 编写 方式 和 普通 的 MATLAB 程 序 类 
似 ， 如 果 有 返回 值 ， 应 在 函数 体 中 为 输出 变量 赋 
值 。 

2. 一 个 M 文 件 的 例子 请 断 


可 以 在 命令 行 输入 edit imfinfo 查 看 完整 源 文 
件 。 


wa info = imfinfo(filename, format) X 


因数 定义 


%IMFINFO Information about graphics file. % 
H1 行 


% INFO = IMFINFO(FILENAME,FMT) returns a structure wh 
ose % 帮 助 文 本 


№ fields contain information about an image іп a grap 
hics 

% file. FILENAME is a string that specifies the name 
of the 

% graphics file, and FMT is a string that specifies t 
he format 

% of the file. The file must be in the current direc 

tory or in 

% а directory on the MATLAB path. If IMFINFO cannot 

find a 

№ file named FILENAME, it looks for a file named FILE 

МАМЕ.ЕМТ. 

% 

% The possible values for FMT are contained іп the fi 
Іе format 

% registry, which is accessed via the IMFORMATS comma 
nd. 

% 

% If FILENAME is а ТТЕР, HDF, ICO, GIF, ог СОК file с 

ontaining more 

% than one image, INFO is a structure array with one 

element for 

% each image in the file. For example, INFO(3) would 
contain 

№ information about the third image in the file. 


% 

% INFO = IMFINFO(FILENAME) attempts to infer the form 
at of the 

% file from its content. 

% 

% INFO = IMFINFO(URL,...) reads the image from an Int 
ernet URL. 

% The URL must include the protocol type (e.g., "http 
SI ja 

% 

% The set of fields in INFO depends on the individual 
file and 

№ its format. However, the first nine fields are alw 
ays the 

% same. These common fields are: 

% 


% Filename A string containing the name of the f 
ile 

% 

% FileModDate A string containing the modification 
date of 

% the file 

X 

m FileSize An integer indicating the size of the 
file in 

% bytes 

X 

% Format A string containing the file format, 
as 

% specified by FMT; for formats with mor 
e than one 

% possible extension (e.g., JPEG and TIF 
F files), 

% the first variant in the registry is г 


eturned 


% 

% 

le format 

% 

% 

% Width 

e image 

% 

% 

% Height 
he image 

% 

% 

№ BitDepth 
its рег 

% 

% 

% Со1огТуре 
; this could 
% 


со1ог' for а 

% 

г a grayscale 
% 

ndexed image. 


FormatVersion A string or number specifying the fi 


version 
An integer indicating the width of th 
in pixels 
An integer indicating the height of t 
in pixels 
An integer indicating the number of b 
pixel 
A string indicating the type of image 
include, but is not limited to, 'true 
truecolor (RGB) image, 'grayscale', fo 


intensity image, or 'indexed' for an i 


% If FILENAME contains Exif tags (JPEG and TIFF only) 


then the INFO 


2 
% struct мау also contain 'DigitalCamera' or 'GPSInfo 


(global 


SS éS L 


positioning system information) fields. 


The value of the GIF format's 'DelayTime' field is 


iven in hundredths 


g 
% ОҒ seconds. 
% 


Example: 


info = imfinfo('ngc6543a.jpg'); 


SS N N XN XN 


See also IMREAD, IMWRITE, IMFORMATS. 


Copyright 1984-2008 The Mathworks, Inc. 
6 $Revision: 1.1.6.14 $ $Date: 2009/11/09 16:27:13 $ 


SS 58 


error(nargchk(1, 2, nargin, 'struct')); X 
函数 体 和 注释 
... (РЁ Б) 
% Delete temporary file from Internet download. 
if (isUrl) 
deleteDownload(filename); 
end 


1.2 MATLAB 图 像 类 型 及 其 存储 
ЯЗ, 

在 0.1.3 小 节 介 绍 数字 图 像 的 分 类 时 ， 曾 接触 到 
一 些 主要 的 图 像 类 型 。 本 节 就 来 看 一 看 这 些 主要 的 
图 像 类 型 在 MATLAB 中 是 如 何 存储 和 表示 的 ， 主 要 


ARRA ВСВ. RIR А 
Жл Ж -o 


1. 亮度 图 像 (Intensity Image) 


亮度 图 像 即 灰 度 图 像 。MATLAB 使 用 二 维和 矩阵 
存储 亮度 图 像 ， 窍 阵 中 的 每 个 元 素 直 接 表 示 一 个 像 
素 的 亮度 〈 灰 度 ) 人 信息。 例如， 一 个 200x300 像 素 
的 图 像 极 存储 为 一 个 200 行 300 列 的 窍 阵 ， 可 以 使 用 
1.1.5 小 节 介 绍 的 选取 矩阵 元 素 〈( 或 子 块 ) 的 方式 来 
选择 图 像 中 的 一 个 像素 或 一 个 区 域 。 


如 果 和 矩阵 元 素 的 类 型 是 双 精 度 的 ， 则 元 素 的 取 
值 范 围 是 从 0 到 1; 如 果 是 8 位 无 符号 整数 ， 则 取 值 
泡 围 从 0 到 255。 数 据 0 表 示 黑 色 ， 而 1 (或 255) Ж 
示 最 大 亮度 (通常 为 白色 ) 。 


图 1.8 所 示 征 一 个 使 用 双 精 度 窃 阵 存 储 胸 度 图 像 
的 例子 。 


0.2051 0.2157 0.2826 0.3822 0.4391 
0.5342 0.2251 0.2563 0.2826 0.2826 0.4391 0.4391 
0.5342 0.1789 0.1307 0.1789 0.2051 0.3256 0.2483 
0.4308 0.2488 0.2624 0.3344 0.3344 0.2624 0.2540 


0.3344 0.2624 0.3344 0.3344 0.3344 





图 1.8 MATLAB 中 亮度 图 像 的 表示 方法 


2. RGB 图 像 (RGB Image) 


RGB 图 像 使 用 3 个 一 组 的 数据 表达 每 个 像素 的 
颜色 ， 即 其 中 的 红色 、 绿 色 和 蓝 色 分 量 。 在 
MATLAB 中 ，RGB 疼 像 被 人 存储 在 一 个 m хп x3 的 三 
维 数组 中 。 对 于 图 像 中 的 每 个 像 系 ， 存 储 的 3 个 两 
色 分 量 合 成 像素 的 最 终 颜 色 。 例 如 ，RGB 图 像 I 中 
位 四 在 11 行 40 列 的 像 双 的 RGB 值 为 I(11,40,1:3) 或 
1(11,40,:), 8328 WJZL 6 27и 771(11,40,1), HEN 
量 为 I(11,40,3)。 而 IT) 则 表示 整个 的 红色 分 量 图 


ж. 


RGB 图 像 同 样 可 以 由 双 精度 数组 或 8 位 无 符号 
整数 数组 存储 。 图 1.9 所 示 是 一 个 使 用 双 精 度数 组 存 
储 RGB 图 像 的 例子 ， 


.2235 0.1294 Blue аз ks 


0.5176 0, 1922 0.0627 Green А, 
0.5176 0.1294 0.1608 0.1294 О. 9: 
О.5176 Sai. 0.0627 0. 





图 1.9 MATLAB 中 RGB 图 像 的 表示 方式 


з. 51 1% (Indexed Image) 
过 引 图 保 往 往 包 仿 两 个 数组 ， 一 个 图 像 数 据 滤 


Е (Image Matrix) 1—4“ 5| + 
(Colormap) „ ЖЛ ТНВ, BNA 
A zH at АУЕ ТАТЕ о 42 5118. 


颜色 索引 表 是 一 个 m x3 的 双 精 度 型 矩阵 ， 每 一 
行 指定 一 种 颜色 的 3 个 RGB 分 量 ， 即 color = [R G 
B]。 其 中 R、G、B 是 实数 类 型 的 双 精 度数 ， 取 但 0 
人 1。0 表 示 全 黑 ，1 表 示 了 最 大 蜗 度 。 图 1.10 给 出 一 个 
索引 图 像 的 实例 ， 注 意图 像 中 的 每 个 像 隶 都 用 整数 
表示 ， 其 含义 为 斋 色 索引 表 中 对 应 两 色 的 索引 。 


RAAE E EMR ER RRR F ENA 
BIERE PE P TF ME Н AERA де ОН ЛЕ ААН K EBA 
无 从 写 整 数 。 


ИП Ж КЕЖЕ ЕЧ ОАЕ ТҮЛИ, BRAE 
1756ж 51464, DAR 2 ИДЕ 
索引 表 中 的 第 二 行 ， 依 此 类 推 。 而 如 果 图 像 数 据 使 
用 8 位 无 付 写 整数 和 存储， 则 存在 一 个 笑 外 的 仿 移 
量 -1， 像 系数 据 0 表示 颜色 索引 表 中 的 第 一 行 ， 而 1 
表示 索引 表 中 的 第 二 行 ， 以 此 类 推 。 


8 位 方式 存储 的 图 像 可 以 支持 256 种 闫 色 (或 
25624 28) 。 图 1.10 中 ， 数 据 窍 阵 使 用 的 是 双 精 度 
с кени 数据 5 表示 颜色 表 中 的 第 5 
种 颜色 。 





ERIE АЕ PE 


14 17 21 21 53 5 





1.10 MATLAB 中 索引 图 像 的 表示 方法 


4. 181% (Binary Image) 


ЕА И, АЈА ЯВ N Fi u] Be Hy 
值 : Н. MATLABE 1 У — ZË 
官 阵 ， 每 个 元 素 的 取 值 只 有 0 和 1 两 种 情况 ，0 表 示 
黑色 ， 而 1 表示 白色 。 


二 值 图 像 可 以 被 看 作 古 一 种 特殊 的 只 存在 黑 和 
日 两 种 颜色 的 完 度 图 像 ， 当 然 ， 也 可 以 将 二 信和 图 候 
ани ( 黑 和 日 ) 的 
系 引 网 像 。 


MATLAB 中 使 用 uint8 型 的 逻辑 数组 存储 二 值 


КИЙ, 2801 ул A Си. 6 021) 
1， 而 如 末 岂 辑 标志 .未 被 置 位 ， 则 有 效 沁 围 为 0 到 
255. 


二 值 图 像 的 表示 方法 如 图 1.11 所 示 。 





图 1.11 MATLAB 中 二 值 图 像 的 表示 方法 


5. ID É (Multiframe Image Array) 


对 于 某 些 应 用 ， 可 能 要 处 理 多 幅 按 时 间或 视角 
方式 连续 排列 的 图 像 ， 称 之 为 多 帧 图 像 (所 谓 “ 帧 
”了 驶 是 影像 动 男 中 最 小 单位 的 单 幅 影像 国 面 ) 。 例 
如 核磁 共振 成 像 数据 或 视频 卢 断 。Matlab 提 供 了 在 
同一 个 矩阵 中 存储 多 帧 图 像 的 方法 ， 实 际 上 束 古 在 
独 像 下 阵 中 增加 一 个 维度 来 代表 时 间或 视角 信息 。 
例如 ， 一 个 拥有 5 张 连续 的 400x300 像 系 的 RGB 图 像 
НАЈ ЖЕЕ Fr r J r fiñ Л aka: 15400х300х3х58] 
ERE, —H [Б X sik e Л Ши] ВД 9 — 
400x300x1x5 的 和 矩阵 来 存储 。 


ИП Ж Z ИИ Н ЖО ИАА, RA 
ЧИНЕ ВЕЕ Z pij т\н, ОИЕ z 5|& JA 


НЕД Н» БИШ, ТЕ# ИЖ 5 ИН, MAKIRI 
ЖАН АЕ 5] 2, ЖИП АНЕЛ ЛУАН А Но, 


РА 
сар Жн] РДТЕТВ ЛЕ ЖЕРЕ БЕ ДН, ЯЯ Н 27 


式 如 下 


ia 


CAT(DIM, Al, A2, ..); 


此 函数 在 第 DIM 维 肛 将 第 2 全 第 n 个 参数 据 供 的 
数组 连接 起 来 。 于 是 ， 右 要 构 志 一 个 由 5 幅 RGB 图 
像 构成 的 多 帧 图 像 组 ， 使 用 的 命令 如 下 。 


ANIM=CAT(4, А1, А2, АЗ, A4, А5); 


Ф PETA JJ ТАН HIRR til 
КИЖИ Т АЯА ЧАЈ Es ри ЖЯ ВЕЛКЕ К {ЖЛЕ 


Е ВЕЗАНЕ, AA, н] РД ЕИ 
处 理 拥 有 4 个 维度 或 5 个 维度 的 RGB 图 像 或 者 连续 各 
像 序 列 ， 但 这 需要 单独 处 理 每 帧 符合 要 求 的 亮度 /二 
值 / 索 引 /RGB 图 像 。 例 如 ， 显 示 ANIM 中 的 第 3 帧 图 
像 需 要 使 用 如 下 方式 。 


ітѕһом(АМІМ( :,:,:,3)); 


РЁ тпѕһом ВЕН х a MA, Е DL1.5 
j: 


VS 
Кы 


WMR TP {Ж y А ТВЕН АРЗ НОЈЕ АЧ КИЛЕР, Ж 
么 结束 可 能 是 不 确定 的 。 示 些 函 数 的 行为 可 能 是 处 理 图 像 的 第 一 师 或 
第 一 个 闫 色 维 上 度 ， 但 人 守 些 函数 可 能 市 来 不 确定 的 行为 和 人 处理 结 来 。 


驮 认 情 况 下 ，MATLAB 将 绝 大 多 数 数 据 存 储 为 
双 精 度 类 型 〈64 位 序 点 数 ) 以 保证 运算 的 精确 性 。 
而 对 于 图 像 而 言 ， 这 种 数据 类 型 在 图 像 尺 寸 较 大 时 
可 能 并 不 理想 。 例 如 ， 一 张 1000 像 素 见 方 的 图 像 拥 
有 有 100 万 个 像 系 ， 如 果 每 个 像 系 用 64 位 二 进 制 数 表 
示 ， 总 共 需 要 大 约 8MB 的 内 存 空 间 。 


为 了 减 小 图 像 信 息 的 空间 开销 ， 可 以 将 图 像 信 
居 存 为 8 位 无 符号 整 型 数 (uint8) 或 16 位 无 符号 整 
型 数 (uint16〉 的 数组 ， 这 样 只 需要 双 精 大 浮 点 数 


1/8 或 /4 的 空间 。 在 上 述 3 种 存储 类 型 中 以 双 精 度 和 和 
uint8 人 使 用 最 多 ，uint16 的 情况 与 uint8 大 致 基 似 。 


1.3 MATLAB 的 图 像 转 换 
1.， 图像 存储 格式 的 互相 转换 


有 时 必须 将 图 像 存 储 格 式 加 以 转换 才能 使 用 才 
些 图 像 处 理 函 数 。 例 如 ， 当 使 用 未 些 MATLAB 内 凋 
的 滤 镜 时 ， 需 要 将 索引 图 像 转 换 为 RGB 图 像 或 者 灰 
上 度 图 斧 ，MATLAB 才 会 将 图 像 泥 镜 应 用 于 图 像 数 据 
本 里 ， 和 而 个 十 索 引 图 像 中 的 闫 色 索 引 值 表 (这 将 产 
生 无 意义 的 结 未 ) 。 


MATLAB 提 供 了 一 系列 存储 格 却 转换 函数 ， 如 
表 1.11 所 示 。 它 们 的 名 字 都 很 便于 记忆 ， 例 如 
ind2gray 可 以 将 索引 图 像 转 化 为 灰 度 图 像 。 


表 1.11 图 像 格 式 转换 函数 











使 用 抖动 的 方式 创建 较 小 颜色 信息 量 的 图 像 。 例 如 从 灰 度 图 转换 成 黑白 图 ， 或 
者 从 RGB 图 转换 成 索引 图 。 多 数 时 候 返 回 uint8 类 型 的 图 像 ， 如 果 输 出 图 像 是 包 
含 大 于 256 色 颜色 表 的 索引 图 ， 则 使 用 uint16 类 型 











从 灰 度 图 转换 成 索引 图 。 多 数 时 候 返 回 uint8 类 型 的 图 像 ， 如 果 输 出 图 像 是 包含 
大 于 256 色 闫 色 表 的 索引 图 ， 则 使 用 uint16 类 型 。 例 如 : 





[Х,МАР] = gray2ind(I,N), ХУ ŽE, MAPEK; 输入 I 为 原始 图 
№, МУЖ УЕН 





Х=ргауѕісе(ї,№) 
Х=ргауѕісе(ї,У) 


(EA ВЕ JA JK РА ЖО Р. ZARR pluint8 KWARA, lin: 如 果 
н о K T 256% @ ЖШ] ж 5] Ё, ЛИ Huin. 

grayslice 
X 为 输出 的 索引 图 像 ，N 为 需要 均匀 划分 的 国 值 个 数 ，V 为 给 定 的 国 值 癌 量 








| ВДЕ Л 2 РА. RI АСВ — B Б. 2 ар Е [ТРН B 
Шы у= im2bw(LLEVEL) 或 BW = im2bw(X,MAP,LEVEL), LEVEL ЕНИН. 
УИЛ УЕ a 972705, ТЕШ үтү? 


ind2er 从 索引 图 创建 灰 度 图 。 返 回 的 图 像 与 原 图 像 存 储 类 型 相同 。 例 如 : 
InC28ray |I= ind2gray(X,MAP) 


| 从 索引 图 创建 RGB 图 ， 返 回 double 类 型 存储 的 图 像 。 例 如 
БР |RGB = ind2rgb(X,MAP) 


[ЕН — Po 阵 中 的 数据 扩展 成 对 应 的 灰 度 图 ， 返 回 图 像 使 用 double 
型 存储 。 
mat2gray | 例如 р mat2gray(A,[AMIN AMAX])，AMIN 和 AMAX 指 定 了 函数 在 转换 时 使 





用 的 下 限 和 上 限 。A 中 低 于 AMIN 和 高 于 AMAX 的 数据 将 被 截取 到 0 和 1 


从 RGB 图 创建 灰 度 图 ， 返 回 图 像 与 原 图 像 存储 类 型 相同 。 例 如 : 
AN I = rgb2gray(RGB) 
80481A | 也 可 以 处 理 颜 色 表 ， 调 用 方式 为 : 


NEWMAP = rgb2gray(MAP)， 此 时 输入 输出 类 型 均 为 double 


从 RGB 图 创建 索引 图 。 多 数 时 候 返 回 uint8 类 型 的 图 像 ， 如 果 输 出 图 像 是 包含 大 
于 256 色 闫 色 表 的 索引 图 ， 则 使 用 uint16 类 型 。 例 如 : 
rgb2ind |[X,MAP] = rgb2ind(RGB,N) 





X = rgb2ind(RGB,MAP) 
N 为 颜色 表 中 颜色 的 数目 ，MAP 为 输出 或 给 定 的 颜色 表 














也 可 以 使 用 一 些 定 阵 操 作 困 数 实 现 菏 些 格式 的 
转换 。 例 如 ， 下 面 的 语句 可 以 将 一 幅 灰 上 度 图 像 转换 
为 RGB 图 像 。 


RGBIMAGE = CAT(3, GRAY, GRAY, GRAY); 


2. КИЖИ ZS АТТА 


MATLAB 图 像 处 理工 具 箱 中 文 持 的 默认 图 像 数 
据 类 型 是 uint8， 使 用 imread 函 数 读 取 图 像 文 件 一 般 
都 为 uint8 类 型 。 人 然而， 很 多 数学 函数 如 sin 等 并 不 支 
持 double 以 外 的 类 型 ， 例 如 当 试 图 对 uint8 类 型 直接 
i MATLAB 会 提示 如 下 的 
音 误 信 息 。 


I = imread( “coins.png?); % 谈 入 一 由 unit8 疼 像 
ѕіп(І); 


??? Undefined function ог method 'sin' for input argume 
nts of type 'uint8' 





针对 这 种 情况 ， 除 了 使 用 1.1.4 小 节 介 绍 的 强制 
类 型 转换 方法 外 ， 还 可 利用 图 像 处 理工 具 箱 中 的 内 
置 图 像 数 据 类 型 转换 函数 。 内 置 转换 函数 的 优势 在 
于 它们 可 以 帮助 处 理 数 据 侦 移 量 和 归 一 化 变换 ， 从 
而 傈 化 了 使 用 者 的 编程 工作 。 


一 些 党 用 的 图 像 类 型 转换 函数 如 表 1.12 所 示 。 
表 1.12 图 像 数据 类 型 转换 函数 





im2uint8 将 图 像 转换 为 uint8 类 型 


im2uint16 将 图 像 转换 为 uint16 类 型 


可 以 在 使 用 MATLAB 数 学 函数 前 将 图 像 转换 为 
double 类 型 ， 而 在 准备 将 图 像 与 入 文件 时 再 将 其 转 
换 为 uint8 类 型 ， 如 下 所 示 。 





I d = im2double(I uint8); % 将 uint8 图 像 转换 为 double 类 型 ， 
灰 度 范围 也 相应 从 [6，255] 归 一 化 至 [6，1] 
Iout а = sin(I а); % 进 行 数学 计算 


Iout uint8= im2uint8(Iout а);  % 转 换 回 uint8〔 灰 度 范 围 也 
重新 扩展 到 [6，255]〉， 准 备 写 入 文件 





14 УЛЕС 


MATLAB 可 以 处 理 以 下 的 图 像 文件 类 型 : 
BMP. HDF. JPEG. PCX. TIFF. XWD. ICO. 
GIFE、CUR。 可 以 使 用 imread 和 imwrite 函 数 对 图 像 
文件 进行 读 写 操作 ， 使 用 imfinfo 函 数 来 获得 数字 图 
像 的 相关 信息 。 


1. imread() K ži 


imread() 函 数 可 以 将 指定 位 置 的 图 像 文 件 证 入 
工作 区 。 对 于 际 逐 引 图 像 以 外 的 情况 ， 其 原型 如 
下 


参数 说 明 : 


° FILENAME 指 定 图 像 文件 的 完整 路 径 和 文件 
名 。 如 各 要 谈 入 的 文件 在 当前 工作 目录 中 或 者 
中 给 出 的 路 径 下 ， 则 只 需 提 供 文 

。FMT 参 数 指定 图 像 文件 的 格式 所 对 应 的 标准 扩 
展 名 ， 例 如 GIF 等 ， 如 果 imread 没 有 找到 
FILENAME 有 所 指定 的 文件 ， 它 会 笠 试 
ЕП.ЕМАМЕ.ЕМТ. 


返回 值 : 


° AE Tt Ч) ДУЕЛ, € 
是 一 个 m {тп 列 的 矩阵 对 于 RGB 真 彩 图 ， 则 是 
一 个 mm хп x3 的 矩阵 。 对 于 大 多 数 图 像 文件 ，A 
的 类 型 为 uint8; 而 对 于 菜 些 TIFF 和 PNG 图 像 ，A 
的 类 型 为 uint16。 


对 于 索引 图 像 ， 情 况 有 所 不 同 ， 此 时 imread 的 


调用 形式 如 下 。 


[X, MAP] = imread(FILENAME, FMT); 


ЖЕТЕ РИА, ХЕ Ë, МАРИ 
AF6 ЖЫ] ж» BAF ERER 5] Aa E 
到 0 到 1 的 范围 内 。 因 为 ， 对 于 索引 图 像 ， 不 论 图 像 
文件 本 喘 使 用 何 种 数据 类 型 ，imread 函 数 都 会 使 用 
双 精 度 类 型 存储 图 像 数 据 。 


imread 国 数 还 可 以 处 理 RGBA 等 格式 存储 的 图 
像 ， 可 以 通过 在 命令 窗口 中 输入 help imread3 r 
MATLAB 中 有 关 imread 的 在 线 帮助 信息 。 
2. imwrite M ži 

imwrite()J$ 8 E АУ 1 9008 5) А AR, ЖЧ 


8 定 人 不 同 的 保存 文 件 扩 展 名 ， 可 以 起 a 到 图 像 格式 转 
换 的 作用 (参见 例 1.4) 。 其 调用 格式 如 下 。 


imwrite(A, FILENAME, FMT); 


° FILENAME 人 参数 指定 文件 名 《不必 包含 扩展 
д) 


。FMT 参 数 指定 保存 文件 所 采用 的 格式 。 


FERI ЧИТ, Жтт ЛИРИ, Ж 5| 
表 ， 则 此 时 imwrite 函 数 的 使 用 方法 应 如 下 。 


imwrite(A, MAP, FILENAME, FMT); 


MAP 是 合法 的 MATLAB 颜 色 索 引 表 。 


imwrite 函 数 还 可 以 控制 图 像 文 件 的 很 多 属性 ， 
例如 TIFF 文 件 格 式 所 选择 的 彩色 空间 、GIF 格 式 中 
的 透明 色 以 及 图 像 文 件 的 作者 、 版 权 信 息 、 解 析 度 
和 创建 软件 等 。 


【 例 1.4】 读 入 一 幅 tf 图 像 文件 ， 并 在 写 入 磁 
榜 时 将 tf 图 像 半 换 为 bmp 图 像 。 


>>I=imread('pout.tif'); % 读 入 图 像 
>>whosI % 答 看 图 像 变 量 信息 

Name Size Bytes Class 

I 291x240 69840 uint8 array 
Grand total is 69840 elements using 69840 bytes 
AH piwhosi > Н] UARRA Ji 2J291, W240 NARE BRINE 
一 个 291*246 的 二 维和 矩阵 


>>imwrite(I, 'pout.bmp'); % 将 图 像 写 入 文件 pout.bmp， 同 时 起 
到 了 转换 文件 类 型 的 作用 





例 1.4 中 的 功能 已 经 做 封 泪 在 金 逆 图 书 伦 坛 


(http://bbs.book95.com) WEI 9 9 5656" 9: 
与 本 书 同名 的 主题 帖子 附件 中 的 “Chapter1/Code” 目 
录 下 的 “ex1_4.m” 文 件 内 。 


З. imfinfo() K 2 
іпбіпѓо() Р 2% HJ РЛ pr Hy ЖЇР 6 {[# 


ал, ШАМЕН. ХА. EA” me, ЛУ, 
Еж. WETE TETAS. Н К. 


imfinfo(FILENAME, FMT); 


° FILENAME 参 数 指定 文件 名 : 
e。 上 MT 人 参数 是 可 选 参 数 ， 指 定 文 件 格式 。 


【 例 1.5】 EERE E o 





>>imfinfo('pout.tjf') % 查 看 图 像 文件 信息 
ans =Filename: 'F:NProgram Files\MATLAB\R2011a\toolbox\ 
images\imdemos\pout.tif' 
FileModDate: '64- 十 二 月 -2666 13:57:50' 
FlleSize: 69004 
Format: 'tif' 
FormatVersion: |] 
Width: 240 
Height: 291 
BitDepth: 8 
ColorType: 'grayscale' 
FormatSignature: [73 73 42 Ө] 


ByteOrder: 


NewSubFileType: 
BitsPerSample: 


Compression: 


PhotometricInterpretation: 
StripOffsets: 
SamplesPerPixel: 
RowsPerStrip: 
StripByteCounts: 
XResolution: 
YResolution: 
ResolutionUnit: 


Colormap: 


PlanarConfiguration: 


TileWidth: 


TileLength: 
TileOffsets: 
TileByteCounts: 
Orientation: 


FillOrder: 


GrayResponseUnit: 
MaxSampleValue: 
MinSampleValue: 

Thresholding: 


Offset: 


15 图像 的 显示 


'little-endian' 

2 

8 

'PackBits' 
'BlackIsZero' 

[9х1 double] 

1 

34 

[9х1 double] 

72 


68754 


— JE Н imshow РА 22 6 40 2882, 12 u] pl 
ВП 9, ААА А КИЙЛИ < E 
性 ， 从 而 简化 编程 操作 。 这 里 介绍 imshow 函 数 的 几 


种 第 见 调 用 方式 。 
1. imshow P% 2⁄4 
imshow р 9 T z L1E K zk |] SLAF F НУ Я 


Ë, ТЕНЕ а СН, НЕЛЯ 
ТОШ К. 


imshow(I, [low high], рагат1, valuel, рагат2, value2, 


imshow(I, MAP) 


imshow(filename) 





° TNB R H BRIERE. 

。 可 选 参数 [low high]f8 jE w zS AKE BRNA H'J ZK J 
WE, ЛВ Гом Кл» уле t, m 
于 high 的 像 系 修 显 示 为 日 色 ， 介 于 low 和 high 之 
旧 的 像 又 被 按 比 例 显 示 为 各 种 等 级 的 灰色 。 如 
打 将 此 参数 指定 为 空 算 阵 [ ]， 则 函数 会 将 图 像 
Ж Н Н) ЛМЕТИ E Лом. ¿KB TH A Л 
high, ААЛА Ж/Е ИН АУ ERAR. AAA 
T о АЛЕ КЖЕ) ERAR o 

可 选 参数 param1l1、value1、param2、value2 等 可 
以 用 来 指定 显示 图 像 的 特定 方法 。 
MAP 为 颜色 索引 表 ， 除 了 电 示 索引 图 像 ， 这 在 
显示 伪 彩 色 图 像 时 也 可 用 到 。 


。filename 参 数 指定 图 像 文 件 名 ， 这 样 可 以 不 必 将 
图 像 文 件 首 先 读 入 工作 区 。 


【 例 1.6】 图 像 文件 的 读 取 、 江 示 、 回 号 。 


% ех1 6.m 

% 读 取 图 像 文件 

>>I = imread('gantrycrane.png'); 
% 显示 图 像 


>>imshow(I); 
% 写 回 到 文件 


>>imwrite(I, 'gantrycrane.tif', TIFF ) ; 





2. 2 iE BAN i zF 

A T Я Z РАИ E Y РД ЕЈ lu] 
的 异同 ， 这 在 考察 不 同 算法 对 同一 幅 图 像 的 处 理 效 
果 时 尤为 有 用 。 


可 以 在 同一 窗口 或 者 个 同 有 的 窗口 显示 多 幅 图 
像 ， 这 两 种 方式 的 实现 如 例 1.7 所 示 。 


【 例 1.7】 7 IB 





% ех1 7.m 
I = imread(?pout.tif?'); % 读 取 图 像 


% 在 不 同窗 口 显 示 
figure; % 创 建 一 个 新 的 窗口 


imshow(I); 
figure; 
imshow(I, [ ]); 
% 在 相同 窗口 显示 
figure; 
subplot(1, 2,1); 
imshow(I); 
subplot(1,2,2); 
imshow(I, [ ]); 





上 述 程序 中 figure 函 数 用 于 新 创建 一 个 显示 窗 
O, БАШЛ a gr BJ 36 2528 п Ji АЧИ; subplot(m 
п.р) WJ Хз, 377—9 т {тп IRAMA 
的 窗口 ， 并 将 焦点 位 于 第 p 个 位 置 上 。 


y —. 





TELER Ée Н ЛУ EEEREN. H -T 51 BAE H 
[ЖД ЖН] НЕМЕ], ШШ 32687 J pl 6 ESA АТЛ КВА), ж © 
H 86 4ríñ256Fh 6, ОЕ, ТЕ И Е ЕШ 256 
种 ， 则 超出 的 部 分 将 不 会 修正 确 显 示 。 所 以 ， 通 第 先 使 用 ind2rgb(1) 将 
图 像 转换 为 RGB 模式 。 此 外 ， 也 可 以 使 用 subimage(Lmap)， 这 个 函数 
在 显示 图 像 之 六 会 目 动 将 其 转换 为 RGB 格式 。 


З. © їл) л 


ТЕ жй ZL ЖШ, ЈЕЛ Sr = ira НАЈ DI, 
ПЕТЕ [Б] АУ О рУ, ЈР m 4 
像 转 化 成 电影 播放 出 来 。 这 3 种 方式 的 实现 分 别 如 
例 1.8 所 示 。 


【 例 1.8】 多 幅 图 像 D， 存 储 了 一 组 索引 图 
像 ，MAP 为 颜色 索引 表 。 分 别 以 上 述 的 3 种 方式 显 
示 它 们 。 


>>load mri % 载 入 Matlab 自 带 的 核磁 共振 图 像 
>>imshow(D(:,:,7), map); % 显示 多 幅 中 的 一 幅 


% 同一 窗口 显示 
>>figure, montage(D, map); 


% 转化 成 为 电影 

>>figure 

>>mov=immovie(D, map); 
>>colormap(map); % 设 定 颜色 表 
>>movie(mov); % 播 放电 影 





EIRP (http://bbs.book95.com) MWE 
羽 图 书 与 众 疑 "板块 与 本 书 同 名 的 主题 帖子 附件 
H “chapter1/code” H>< F Ҥ])“ех1_8.т” LAFEE / W 
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有 了 时 需要 将 图 像 的 菜 一 部 分 放大 以 全 看 局 部 的 
详细 情况 。 只 需 输 入 zoom on 命令 即 可 实现 图 像 的 
ЛАЛА, zoom off 可 以 关闭 图 像 族 缩 功 能 。 打 开 疼 像 
， 隐 可 以 通过 人 简单 的 忌 标 操作 观 家 名 

细部 了 。 


5. 像 系 值 但 看 工具 


使 用 imshow 函 数 显 示 一 幅 图 像 之 后 ， 可 以 通过 
输入 impixelinfo 命 令 在 最 后 显示 的 图 像 窗口 的 左下 
角 ， 随 鼠标 光标 的 移动 显示 鼠标 指针 所 指 位 置 处 的 
像素 值 ， 如 图 1.12 所 示 。 
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显示 限 标 所 在 
位 置 的 像 系 值 
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还 可 以 通过 imdistline 命 令 以 交互 的 方式 和 个 看 民 
像 中 两 点 之 间 的 距离 ， 如 图 1.13 所 示 。 


Command Window “PR. IPL. ал х 
ЕЛ] Figure 1 _ 
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>> impixelinfo 





imdistline handle with no properties. 


Methods, Events, 


fx >> „ 
y 





Superclasses 





图 1.13 ”使 用 imdistline 命 令 查 看 距离 


第 2 章 Visual C++ 图 像 处 理 编程 基 
fm 


Visual C++ 是 Windows 下 的 C++ 集成 设计 环 
境 ， 随 看 Windows 操 作 系 统 的 普及 ， 在 Visual 
C++ 下 实现 图 像 处 理 束 成 为 了 在 普 角 PC 上 进行 数字 
镜像 处 理 的 最 佳 途 径 。 


21 位 图 文件 及 其 C++ 操作 


Windows 操 作 系 统 中 使 用 最 多 有 的 图 形 文 件 格 式 
就 是 位 图 格式 ， 最 常见 的 位 图 文件 的 扩展 名 为 
BMP。BMP 是 英文 Bitmap (位 图 ) 的 简写 ， 这 种 格 
式 的 特点 是 包含 的 图 像 信 息 较 丰富 ， 几 乎 不 进行 压 
缩 ， 因 此 它 占 用 的 磁盘 空间 较 大 。 下 面 主 要 介绍 使 
用 Visual C++ 对 BMP 文件 的 操作 。 


211 设备 无 天 位 图 


Windows 3.0 以 后 的 BMP 位 图 文件 格式 与 显示 
设备 无 天 ， 因 此 把 这 种 BMP 位 图 文件 称 为 设备 无 关 
位 图 (Device Independent Bitmap, DIB) > ОЇВН 
市 颜色 信息 ， 因 此 调 色 板 管 理 非常 简单 。 现 在 ， 任 
何 Windows 操 作 系 统 的 计算 机 都 能 够 显示 和 人 处理 


DIB, ЛШ UBMP XAF MIE KAK TK Н. 
21.2 BMP 图 像 文件 数据 结构 


典型 的 BMP 图 像 文件 由 以 下 4 部 分 组 成 ， 如 图 
2.12775. 

















bfType 
bfSize 
bfReserved 1] 
bfReserved2 
bfOffBits 


位 图 文件 头 
BITMAPFILEHEADER 


blSlze 
biWidth 
biHeight 
т biPlanes 
位 图 信息 头 biBitCount 
BITMAPINFO HEADER biCompression 
biSizeImage 
biXPelsPerMeter 
bi Y PelsPerMeter 
biClrUsed 
biClrImportant 





调 色 板 RGBQUAD Mit RAH 
表 项 的 数目 由 颜色 数目 决定 

Palette 每 个 表 项 长 度 为 4 个 字 节 

真 彩色 图 像 没 有 调 色 板 






实际 的 位 图 数据 
DIB Pixels 


像 系 按照 从 下 到 上 、 从 左 到 右 
的 顺序 排列 每 行 占用 的 空间 必 
须 是 4 的 整 倍数 


42.1 BMP 文件 的 组 成 


(1) 位 图 文件 头 (BITMAPFILEHEADER) 
数据 结构 ， 包 含 BMP 图 像 文 件 的 类 型 、 显 示 内 容 等 


= 


(2) 位 图 信息 头 (BITMAPINFOHEADER) 


数据 结构 ， 包 含有 BMP 图 像 的 宽 、 高 、 压 缩 方法 以 
及 定义 颜色 等 信息 ， 


(з) 调 色 板 ， 即 颜色 索引 表 。 

(4) 实际 的 位 图 数据 ，。 

下 面 分 别 介 绍 BMP 图 像 文 件 的 这 4 个 部 分 。 
1. 位 图 文件 头 (BITMAPFILEHEADER) 结构 


位 图 文件 头 (BITMAPFILEHEADER) 的 定义 
可 以 在 做 软 公 司 提 供 的 类 库 (Microsoft Foundation 
Classes, МЕС) Library 中 找到 ， 这 部 分 文件 头 包 合 
了 位 图 文件 的 类 型 、 大 小 和 包含 设备 无 天 位 图 的 图 
像 文 件 布局 。 


BITMAPEFILEHEADER 结 构 体 具有 固定 的 长 度 
14 字 和 有 有， 其 定义 和 摘 述 如 下 。 





typedef struct tagBITMAPFILEHEADER { 


WORD bfType; // 指定 文件 类 型 ， 必 须 是 “BM”(@x4D42 
) 

DWORD bfSize; // 指定 位 图 文件 的 大 小 ， 以 字 节 表示 

WORD bfReserved1; // 保留 字 ， 必 须 为 8 

WORD bfReserved2; // 保留 字 ， 必 须 为 8 


DWORD bfOffBits; // 指定 从 实际 网 像 数据 到 文件 头 起 始 的 
偏 移 量 ， 以 字 节 为 单位 
y BITMAPFILEHEADER, *PBITMAPFILEHEADER; 


2. 位 图 信息 头 (BITMAPINFOHEADER) 结构 


BITMAPINFOHEADER 结 构 体 中 包含 了 设备 无 
关 位 图 关于 颜色 维度 和 色彩 格式 的 信息 ， 其 定义 和 
摘 述 如 下 。 


typedef struct tagBITMAPINFOHEADER( 
DWORD bisSize; // 本 结构 体 占 用 的 大 小 ， 单 位 为 字 节 
LONG biwidth; // br dR Е, PEZ JJ S< 
LONG biHeight; // МЕЕН, ВИ 
WORD biPlanes; // W КЁЛ ИШАН, #271 5]1 
WORD biBitCount; // fr bh A ж ИТЛЕ Н НУ EA 
DWORD biCompression; // 是 否 压缩 存储 网 像 数 据 
DWORD biSizeImage; // 指定 图 像 的 大 小 《以 字 布 为 单位 ) 
LONG biXPelsPerMeter; // ВУЈКО, s bra 
LONG biYPelsPerMeter; // МЕЕ, PE bra 
DWORD biClrUsed; // іН AWERI rH IJ Z 
> И, 
DWORD bicClrImportant; // 图 象 中 重要 的 颜色 数 ,如 果 该 值 为 
0, 则 认为 所 有 的 颜色 都 是 重要 的 
y BITMAPINFOHEADER, *PBITMAPINFOHEADER; 
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• biBitCount 指 定 存 储 每 个 像 隶 使 用 的 二 进 制 数 据 
位 数 ， 间 接 确 定 图 像 中 可 能 存在 的 最 大 两 色 数 


目 。 可 取 : 1. 4. 8. 16. 24. 32, R: SY DL F 
文 讲解 。 

。biSizeImage 指 定 图 像 大 小 (以 字 市 为 单位 〉。 
biSizeImage=biWidth’ x biHeight。 其 中 
biWidth 是 图 像 每 行 占 用 的 字 节 数 ， 与 实际 宽度 
biWidth 不 同 ，biWidth’ 必 须 是 4 的 整数 倍 ， 即 大 
于 或 等 于 biWidth 的 ， 最 接近 4 的 整 倍 数 。 例 如 ， 
biWidth=400， 则 biWidth’*=400， 如 果 
biWidth=401， 则 biWidth’*=404。 如 果 
biCompression 为 BL_RGB， 访 项 可 能 为 零 。 

• biClrUsed 成 员 指 定 了 在 位 图 图 像 中 实际 使 用 到 
的 颜色 数目 。 如 果 biClrUsed 成 员 被 设置 为 堆 ， 
那么 图 像 中 实际 使 用 的 两 色 数 目 是 和 biBitCount 
成 员 中 规定 的 值 相同 的 最 大 数目 。 


小 技巧 : biBitCount 成 员 


BITMAPINFOHEADER 结 构 的 
biBitCount 成 员 可 用 于 确定 位 图 图 保 中 
每 个 像素 所 占用 的 数据 长 度 〈 单 位 是 
位 ) 和 图 像 中 所 包含 的 最 多 两 色 数 
目 。 这 个 成 员 的 取 全 可 以 有 6 和 种， 分别 


对 应 BMP 图 像 允 许 的 6 种 颜色 模式 。 


BMP 文 件 的 色 深 也 就 古 存储 每 个 像 系 使 用 的 位 
数 有 1 CHE) 4 (16 色 ) . 8 (256%) 、 
16 (64x1024 色 ， 高 彩色 ) 、24 (16х10242 色 ， 真 
彩色 ) 、32 (4096х1024° 色 ， 增 强 型 真 彩色 ) 6 
种 。 它 们 与 biBitCount 之 间 的 对 应 关系 如 下 。 


(1) biBitCount=1， 位 图 图 像 是 单 色 的 ， 并 且 
成 员 bmiColor 有 索引 表 包 含 两 个 条 目 。 位 图 图 像 数 组 
中 的 每 一 个 数据 位 代表 一 个 像 系 。 如 条 这 个 数据 位 
0, ЗНА ж ТЕШЛЕ] Н bmiColorsZ# 5|% P 
的 第 一 种 两 色 : 如 果 这 个 数据 位 是 1， 那 么 此 像素 
在 显示 时 使 用 bmiColors 有 索引 表 中 有 的 第 二 种 磊 色 。 


(2) biBitCount=4， 位 图 图 像 包 含 最 多 16 种 颜 
色 ， 并 且 成 员 bmiColors 索 引 表 中 包含 全 多 16 个 条 
目 。 此 时 位 图 图 像 数 据 区 中 的 每 一 个 像素 条 目 长 度 
是 4 位 (0.5 字 市 ) 。 例 如 ， 如 果 位 图 图 像 数 据 区 的 
第 一 个 字 节 数值 是 0x1F， 这 一 字 节 表示 2 个 像素 的 
ИЛЕ, ВЕЕ У ЗНУ MRE, P 
МЕТЕ о ЖЕЕ ЇЇ? БВ16Л ЛЕ . 


(3) biBitCount=8， 位 图 图 像 包 含 最 多 256 种 


ИЛЕ, ЗЕН. тт ътіСо10:52 516 Б % £ Z256#F 
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(4) biBitCount=16, Л  @ 62210 种 
颜色 ， 并 且 BITMAPINFOHEADER 的 biCompression 
成 员 取 值 必须 为 BI_ BITFIELDS。 此 时 bmiColors 成 
员 包 含 3 个 DWORD 类 型 的 颜色 掩 码 分 别 用 以 指定 每 
个 像素 的 红 、 绿 、 蓝 的 颜色 成 分 。 


(5) biBitCount=24， 位 图 图 像 包 含 最 多 244 种 
颜色 ， 并 且 成 员 bmiColors 索 引 表 为 空 (NULL) 。 
在 位 图 图 像 数 据 区 中 的 每 个 三 比特 组 中 的 数据 表示 
革 个 像素 中 的 红 、 绿 、 蓝 颜色 成 分 的 相对 强度 。 


(6) biBitCount=32， 位 图 图 像 包含 最 多 22“ 种 
颜色 ，BITMAPINFOHEADER 的 biCompression 成 员 
必须 是 BIL_BITFIELDS，bmiColors 成 员 包含 三 个 
DWORD 类 型 的 颜色 掩 码 用 以 指定 每 个 像素 颜色 中 
的 红色 、 绿 色 和 蓝 色 成 分 。 


З. 调 色 板结 构 
有 些 位 图 (如 索引 图 像 〉 需 要 调 色 板 


(Palette) ， 有 些 〈 像 真 彩色 图 ) 则 不 需要 ， 它 们 
的 BITMAPINFOHEADER 后 面 直接 是 位 图 数据 。 


调 色 板 实际 上 是 一 个 RGBQUAD 型 的 数组 ， 该 
数组 总 共有 biClrUsed 个 元 素 〈 如 果 biClrUsed 等 于 
0, ШЗ2Ҥ ЫВиСош k ж лж) 。RGBQUAD 
是 一 个 用 于 存储 RGB 颜色 数据 的 4 个 字 节 的 结构 
体 ， 其 定义 如 下 。 


typedef struct tagRGBQUAD { 
BYTE rgbBlue; [ZWEREN 8 
BYTE rgbGreen; / / 26, ДЈ 77 
BYTE rgbRed; // 该 颜色 的 红色 分 量 


BYTE rgbReserved; / / 17 RE 
} RGBQUAD; 





ww 


除 位 图 调 色 板 外 ， 还 有 逻辑 调 色 板 和 系统 调 色 板 的 概念 。 有 时 ， 
在 更 新 了 位 图 调 色 板 后 需要 更 新 逻辑 调 色 板 和 系统 调 色 板 ， 才 能 将 关 
色 的 变换 正确 地 反映 出 来 。 但 仅 当 系统 处 于 256 色 显示 模式 时 才 需 要 用 
到 系统 调 色 板 ， 而 目前 的 系统 已 经 很 少 使 用 256 色 的 显示 模式 了 ， 因 此 
一 般 不 会 涉及 相关 的 操作 ， 本 书 也 对 此 不 加 讨论 ， 仅 在 DIPDemo 程 序 
中 实现 了 该 逻辑 。 


4. 实际 位 图 数据 


实际 位 图 数据 是 一 厂 连 续 的 存储 区 域 ， 其 中 保 
н КИЯТ ЕКТ ЖАШ АЛЕ ME) 信息 。 对 于 
2566 KERZ. КЖ инле 12 Я HJ SK RK 
В, 17 @ т =1 КАКУ: ЯГ ЖО КИЙ, B 
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于 真 彩色 图 ， 图 像 数据 就 是 实际 的 RGB 值 ，1 个 像 
素 需 要 3 字 节 来 表示 ， 


一 般 来 襄 ，BMP 文 件 的 实际 位 图 数据 是 从 下 到 上 、 从 左 到 右 的 。 
即 从 文件 中 最 完 读 到 的 是 图 像 最 后 一 行 左 边 第 1 个 像 系 ， 然 后 是 左边 第 


ЛВ, ,ss 接 下 米 是 倒数 第 2 行 的 最 让 这 第 1 这 边 第 2 个 ..., 
最 后 是 第 1 行 的 左 侧 第 1 个 像素 ， 第 2 个 像素 ，...， 第 1 行 最 右 侧 的 像 


ŽJN о 


位 图 数据 每 一 行 占用 的 字 节 数 必须 是 4 的 整数 倍 ， 如 果 不 是 ， 则 需 


要 补 齐 。 


22 ”认识 CImg 关 


在 Visual C++ 的 早期 版 本 (6.0 之 前 〉 中， 程序 
员 只 能 通过 API 函 数 对 位 图 进行 访问 和 操作 ;高 版 
本 的 Visual C++ 和 Visual C# 中 ， 微 软 提 供 了 CImasge 
类 封装 了 更 多 的 绘图 功能 和 图 像 操 作 功 能 ， 但 仍然 
没有 提供 完整 的 图 像 处 理 能 力 。 为 此 ， 本 书 在 配套 
光 可 DIPDemo 工 程 中 提供 了 CImg 类 以 实现 对 位 图 
的 访问 及 其 他 一 些 基 本 操作 ， 并 在 此 基础 上 派生 了 
能 够 胜任 大 多 数 图 像 处 理 任 务 的 CImgProcess 类 。 


下 面 介 绍 CImg 类 ， 借 此 来 让 读者 了 解 一 些 算 
法 的 基础 实现 。 如 果 笑 试 编 写 目 己 的 图 像 处 理 类 ， 
本 市 内 容 也 可 以 作为 参考 。 有 大 CImgProcess 关 有 的 


相关 知识 ， 将 在 后 面 的 章节 中 根据 需要 来 前 述 
221 ERR AK 


CImg 关 的 主要 成 员 如 表 2.1 所 示 。 


表 2.1 CImg 类 的 主要 成 员 函 数 


СЛИ СНИ 


BOOL IsValidate(); 判断 位 网 是 效 





void InitPixels(BYTE color); СЕЕ 素 的 值 初 始 化 为 灰 


BOOL AttachFromFile(LPCTSTR lpcPathName); BOOL | S 
AttachFromFile(CFile &file); 从 文件 加 载 位 图 


BOOL SaveToFile(LPCTSTR IpcPathName); BOOL Je > ТЕ 
SaveToFile(CFile &file); 将 位 图 保存 到 文件 


BOOL Draw(CDC* ррс); 将 位 图 绘制 到 设备 平面 


void SetPixel(int x, int y, COLORREF color); 设置 指定 位 置 像素 的 值 





COLORREF GetPixel(int x, int y); 获取 指定 位 置 像 素 的 颜色 值 





BYTE GetGray(int x, int y); ЗЕ EMEA HJ АРЕН 





获取 图 像 数 据 窍 阵 一 行 的 字 


int GetWidthByte(); 71738 


че тетте 


int GetColorTableEntriesNum(); Н ж | ЖП Ж H 23 











如 果 要 在 应 用 程序 中 使 用 CImg 类 ， 请 在 项 目 
中 包含 Img.h 头 文件 和 Img.cpp 源 文件 。 这 里 将 逐 段 
给 出 CImg 类 的 重要 代码 厂 断 并 加 以 说 明 。 在 此 之 
有 前， 先 介 绍 CImg 类 的 公有 成 员 以 及 其 所 提供 的 沿用 
的 成 员 函 数 和 重 载 的 运算 符 。 


在 Visual C++ 的 类 视图 中 可 以 看 到 CImg 类 作为 
一 个 基 类 ， 提 供 了 对 位 图 图 像 的 一 些 基 础 图 像 探 
作 ， 如 从 文件 打开 图 像 、 保 存 图 像 至 文件 、 旋 取 和 


设置 东 个 位 置 像 系 的 灰 度 人 等 ， 此 外 还 重 载 了 各 用 
的 图 像 操作 运算 从 ， 如 按 位 加 C+) 、 按 位 减 

(-) , RE C!) 、 投 位 与 〈&) 、 按 位 或 〈|) ， 
WA (=) 和 相等 《= =) ， 等 等 。 


下 面 对 CImg 闪 的 代码 的 实现 展开 详细 分 术 ， 
读者 可 以 根据 需要 选择 性 地 阅读 下 面 的 内 容 ， 不 一 
定 非 要 将 注意 力 宛 集中 在 这 些 方法 的 细 太 实现 上 ， 
不 妨 先 熟悉 函数 的 功能 和 调用 方法 ， 这 对 于 理解 本 
书后 面 的 图 像 处理 算 法 征 没有 影 啊 的 。 


222 ”公有 成 员 


CImg 关 拥有 如 下 两 个 公有 成 员 。 


BITMAPINFOHEADER *m pBMIH; 
LPBYTE *m lpData; 


Я, m рвВмІН У НИЕ ЗК, 
而 mm_lpData 中 保存 实际 的 图 像 数 据 。 在 此 ， 有 再 次 提 
示 BITMAPINFOHEADER 结 构 的 定义 如 下 。 





typedef struct tagBITMAPINFOHEADER{ 


DWORD bisSize; // 本 结构 体 占用 的 大 小 ， 单 位 为 字 节 
LONG biwidth; // 位 图 图 像 的 宽度 ， 单 位 为 像素 
LONG biHeight; // MRR RE, ВИ 


WORD biPlanes; // 设备 上 两 色 平 面 数 目 ， 必 须 为 1 


WORD biBitCount; // 存储 每 个 像素 所 便 用 的 二 进 制 位 


数 

DWORD biCompression; // EB EMT АИЯ 

DWORD biSizeImage; // Звя 19А 

LONG БЬіХРе15РегМе+ег; // АКРА, л 
вк 

LONG biYPelsPerMeter; // ЈЕ НА, л 
вк 

DWORD biClrUsed; // Ар Н АЕ s| ¿rH HJ 
Zb FRE 


DWORD biClrImportant; // АЗ ЈИЕ, WRZE 
为 6, 则 认为 所 有 的 两 色 都 是 重要 的 
y BITMAPINFOHEADER, *PBITMAPINFOHEADER; 


可 以 很 容易 地 从 m_pBMIH 结 构 中 得 到 位 图 图 
像 的 基本 信息 。 而 图 像 数 据 存 储 杰 量 m_lpData 投 照 
MFC 规 定 的 标准 方式 存储 图 像 信 息 〈 按 照 4-byte 整 
倍数 的 行 长 上 度 和 规定 的 顺序， 以 图 像 的 左上 角 为 坐 
标 原 点 ) ， 因而 也 可 以 直接 从 图 像 文 件 中 近 ) JI EE 
取 到 内 存 。 在 后 面 的 方法 中 ， 将 党 各 使 用 这 两 个 成 
员 © 而 在 Clmg 大 的 私有 成 只 中 ， fm t ТЕЙ Б 


的 相关 信息 ， 以 免 这 些 信息 被 除了 CImg 类 之 外 的 代 
ЇЧ Ух Г 


23 CImg 关 基础 操作 
2.3.1 加载 和 写 入 图 像 


СІте ЖЕЛЕ / ПАТЕ А.К ттш ЗЕ] 
方法 AttachFromFile 和 SaveToFile， 这 两 个 方法 分 别 
提供 了 从 文件 路 径 中 加 载 和 写 入 与 从 文件 对 象 中 加 
载 和 与 入 的 接口 。 它 们 实际 上 是 对 MEFC 库 相关 功能 
的 进一步 封 芭 ， 和 定义 原型 如 下 。 


// 从 文件 加 载 位 图 
BOOL AttachFromFile(LPCTSTR lpcPathName); 
BOOL AttachFromFile(CFile &file); 


// 将 位 图 你 存 到 文件 
BOOL SaveToFile(LPCTSTR lpcPathName); 
BOOL SaveToFile(CFile &file); 





1. AttachFromFile P Ж 


BE НІРСТЅТК2: AII AAGO Н д7 6] 
% / BE R]CFilexX| RAZ RAG, 31.РСТТВ 
ДУВЕ A SPK CFile, ПЛ HJ H 
СЕПе O ВУЛН 19] 775 52. Ж У Л АќасҺЕготЕіер 
и 的 实现 形 却 为 例 进 行 简 要 的 
说 明 。 





站 


BOOL CImg::AttachFromFile(LPCTSTR LpcPathName ) 

功能 : 打开 指定 的 图 像 文件 并 附加 到 CImg 对 象 上 

限制 | : 只 能 处 理 位 图 图 像 

参数 : LPCTSTR lpcPathName: 欲 打 开 文 件 的 完整 路 径 


返回 值 : Воо 277. TRUE 为 成 功 ，FALSE 为 失败 


ЖОКЕ kiku ЗЕ аа 


BOOL CImg::AttachFromFile(LPCTSTR lpcPathName) 


l 
// 使 用 CFile 对 象 简化 操作 
CFile file; 
if(!file.Open(1pcPathName, CFile::modeRead|CFile::sha 
reDenyWrite)) 
return FALSE, 


BOOL bSuc = AttachFromFile(file); 


file.Close(); 
return bSuc; 


} 


„ЖИЛЕ НН KEWAA, 而 后 提取 文件 头 
中 的 图 像 信 息 头 部 分 ， 并 分 析 信 息 头 中 所 含有 的 羚 
色 表 和 图 像 的 其 他 相关 属 性 ， 初 始 化 CImg 对 象 中 的 
相关 成 员 ， 最 后 斌 取 图 像 数 据 。 操 作 中 使 用 了 MFC 
直接 提供 的 位 图 信息 头 BITMAPINFOHEADER 对 
象 。 


参数 为 CEile 对 象 的 AttachFromFile 函 数 的 实现 
如 下 。 





站 


BOOL CImg::AttachFromFile(CFile &file) 
功能 : 打开 指定 的 图 像 文件 并 附加 到 CImg 对 象 上 
参数 : CFile &file: 欲 打开 的 CFile 对 象 


返回 值 ， ”BOO0L 类 型 . TRUE 为 成 功 ，FALSE 为 失败 
ОНР K БЕЗЕ КОЕ О ИИ i У, 


BOOL CImg::AttachFromFile(CFile &file) 


l 
// 文件 数据 
LPBYTE *IpData; 
// 位 图 信息 头 
BITMAPINFOHEADER *pBMIH; 
// 颜色 表 指 针 
LPVOID lpvColorTable = NULL; 
// Е H 


int nColorTableEntries; 
BITMAPFILEHEADER bmfHeader; 


// 读 取 文件 头 
if(!file.Read(&bmfHeader, sizeof(bmfHeader))) 


{ 
return FALSE; 


} 


// 检查 开 尖 两 子 闻 是 合 为 BM 
if(bmfHeader.bfType != MAKEWORD('B', 'M')) 


{ 
return FALSE, 


J 
// 谈 取 信息 头 
pBMIH = (BITMAPINFOHEADER* ) пем BYTE[bmfHeader.bfOff 
Bits - sizeof(bmfHeader)]; 
1Ғ(!+11е.Кеаа(рвмін, bmfHeader.bfOffBits - sizeof(b 
mfHeader ) ) ) 
{ 
delete pBMIH; 
return FALSE; 


} 


// EMEEK 
nColorTableEntries = 
(bmfHeader.bfOffBits - sizeof(bmfHeader) - sizeof( 
BITMAPINFOHEADER))/ 


sizeof(RGBQUAD); 
if(nColorTableEntries > 0) 
{ 
lpvColorTable = pBMIH + 1; 
J 


pBMIH->biHeight = abs(pBMIH->biHeight); 


// 读 取 图 像 数 据 ,WIDTHBYTES 宏 用 于 生成 每 行 字 节 数 
int nWidthBytes = WIDTHBYTES((pBMIH->biWidth)*pBMIH 
->biBitCount); 


// 申请 biHeight 个 长 度 为 biNidthBytes 的 数组 ,用 他 们 来 保存 
位 图 数据 
lpData = new LPBYTE[(pBMIH->biHeight)]; 
for(int i=0; i<(pBMIH->biHeight); i++) 
l 
lpData[i] = пем BYTE[nWidthBytes]; 
file.Read(1pData[i], nWidthBytes); 


} 


// 更 新 数据 
CleanUp(); 


m Ірра+а = lpData; 

m pBMIH = pBMIH; 

m lpvColorTable = lpvColorTable; 

т nColorTableEntries = nColorTableEntries; 


return TRUE; 
J 


2. ЅауеТоЕПерќ 2 


与 AttachFromFile 大 致 相反 ，SaveToFile 中 首先 
判断 位 图 对 象 是 售 有 效 ， 而 后 根据 当前 两 色 表 (WH 
KER MED 和 图 像 的 相关 属性 信息 构造 图 像 信 
恩 头 和 文件 信息 凑 ， 并 将 文件 凑 和 图 像 数 据 写 入 文 
件 。 这 期 间 的 操作 也 大 量 地 使 用 了 MEFC 库 提供 的 位 
独 信 息 头 和 文件 信息 凑 对 象 。 


参数 为 CEile 对 象 的 SaveToFEile 国 数 的 实现 如 


下 
BOOL CImg::SaveToFile(CFile &file) 
功能 : 把 CImg 实 例 中 的 图 像 数 据 保存 到 指定 的 图 像 文件 


参数 : CFile &file: 欲 保 存 到 的 CFile 对 象 
返回 值 : ”BOOL 类 型 . TRUE 为 成 功 ，FALSE 为 失败 


TP. Y ЕЕЕ КЕ КОЕ ЕЕЕ ЛЕ ЕЕ ЕЛЕ БОЕК КЕКЕ ЛЕ ОКЕ ОВИЕ ОРИ 
BOOL CImg::SaveToFile(CFile &file) 
{ 
// Хт Т Ж 
if(!IsValidate()) 
return FALSE; 


// 构建 BITMAPFILEHEADER 结 构 
BITMAPFILEHEADER bmfHeader = { Ө }; 
int nWidthBytes = WIDTHBYTES((m _pBMIH->biWidth)*m p 


BMIH->biBitCount); 


bmfHeader.bfType = MAKEWORD('B', 'M'); 
bmfHeader.bfOffBits = sizeof(BITMAPFILEHEADER) 
+ sizeof(BITMAPINFOHEADER) + m nColorTableEntr 
їе<*4; 


bmfHeader.bfSize = bmfHeader.bfOffBits + m pBMIH->b 
iHeight * nWidthBytes; 


// 同文 件 中 与 入 数据 
file.Write(&bmfHeader, sizeof(bmfHeader)); 


file.Write(m pBMIH, sizeof(BITMAPINFOHEADER) + m_nC 
olorTableEntries*4); 


for(int i=0; i<m pBMIH->biHeight; i++) 


file.Write(m_lpData[i], nWidthBytes); 
} 


return TRUE; 


2.3.2 349 图 像 基 本 信和 局 /DA 


在 得 到 了 一 个 CImg 对 象 后 ， 可 以 通过 下 面 的 
方法 来 获得 位 图 的 相关 信息 (高度 、 宽 度 、 有 效 性 
等 ) ， 这 些 方法 包括 以 下 几 种 。 





int CImg: :GetHeight(); // 获 得 网 像 高 度 
int CImg: :GetWwidthPixel();// 获 得 图 像 宽度 


int CImg: :GetWidthByte();// 获 得 每 行 字 节 数 





这 3 个 方法 都 是 内 联 函 数 ， 它 们 都 是 通过 二 接 
返回 CImg 对 象 的 相关 私有 成 员 属 性 来 得 到 所 需 的 信 
FE. H jx | GetHeightOA GetWidthPixel0 返 回信 都 是 
РД Уу ЕЛ НЈ, ЕЗЕН ЛАЛ: 而 
GetWidthByte0O 返 回 的 是 以 字 节 为 单位 的 РЕ АНТ 
宽度 〈4 的 整数 倍 ) ， 用 于 对 图 像 数 据 进 行 补 齐 操 
Eo FADIA BRKT 


1. GetHeightr 2 


еа 
inline int CImg::GetHeight() 
jx |u|CImg KAE Ru 2 2 2 Н, БП] nk 


: A 
返回 值 : іп: 图 像 每 列 的 像素 数目 
人 / 
inline int CImg: :GetHeight'( ) 
{ 


} 


return m pBMIH->biHeight; 





2. GetWidthPixel 0А 2 


ОРИ TT TT СОЕ 
inline int CImg::GetWidthPixel() 


功能 : 返回 CImg 实 例 中 的 图 像 每 行 的 像 系数 目 ， 即 模 同 分 辩 率 或 
u, ДУ 

参数 : 无 

返回 值 : ”int 类 型 ， 图 像 每 行 的 像素 数目 
人 


inline int CImg::GetWidthPixel() 


l 
return m pBMIH->biWidth; 


} 





3.，GetWidthByte 函 数 


i 
inline int CImg: :GetWidthBytel() 

功能 : 返回 CImg 实 例 中 的 图 像 每 行 占 用 的 字 闻 数 

参数 : 2 

BEE: ”int 类 型 : 图 像 每 行 占用 的 字 节 数 ， 必 须 是 4 的 整数 售 
下 


inline int CImg::GetWidthByte() 


l 
return WIDTHBYTES((m pBMIH->biWidth)*m pBMIH->biBit 
Count); 


} 





其 中 宏 WIDTHBYTES 的 定义 是 如 下 。 


#define WIDTHBYTES(bits) (((bits) + 31) / 32 * 4) // 
保证 每 行 数据 占用 的 空间 是 4 的 整数 倍 





m_pBMIH->biWidth HME mü = Р ж ZJ P. jv Ж 
Л ВЕ, УИН 5 ИВ S IE ЛИШ) y 
KER, HWI BARAT HI HPJ H Ж 1Н 
Же, АНЕ, FITRA ri HI HJ Н AA K 
像 中 每 行 所 需 使 用 的 字 节 数 并 不 一 定 相 等 。 前 文 提 
到 ， 和 需要 将 定义 中 每 行 所 占用 的 空间 补 齐 到 4 的 整 
数 倍 字 节 ，WIDTHBYTES 宏 正 是 为 了 实现 这 一 功 


能 。 
2.3.3 ”检验 有 效 性 


按照 程序 的 健壮 性 原则 ， 不 论 是 从 图 像 文 件 读 
取 而 后 得 到 CImg 对 象 ， 还 是 在 狐 建 对 象 后 使 用 绘图 
国 数 构造 一 幅 图 像 ， 都 需要 在 真正 使 用 访 对 象 之 前 
检验 它 的 有 效 性 。 可 以 通过 检 和 奉公 有 成 员 
m_PBMIH 是 人 否 有 效 来 达到 这 一 目的 。 有 效 性 检验 
国 数 IsSValidate 的 实现 如 下 。 


As 
BOOL CImg: :IsValidate () 

功能 : 检验 图 保 的 有 有 效 性 

参数 : A 

返回 值 : TRUE: 表示 图 像 有 效 


FALSE: 表示 网 像 无 效 


TOKO YP TKT YT T+ YTA КЕТЕРЕ ЕКЕ ЕЕ Е ОООО ККЕ ЕКЕ ЕЕЕ 


BOOL IsValidate() í return m_pBMIH != NULL; } 





IRER, ATE ERIE А Pt Kk ККА Ж 
是 无 效 的 ， 使 用 时 就 会 出 现 错误 。 此 时 ， 用 户 程序 
可 以 选 撞 返 回 一 条 钳 误 信息 或 者 重新 进行 乙 前 的 初 
始 化 操作 。 


23.4 ARTENE 


EIR Т BRAE wa J, MAE / BRŽI 
WA СЧА paqu E, MA ul AR BREITER n 
Jio REAT BAADH pI TIA P Ит e be НУН xE L 
ARKEA, IAE S A ЖЕ E 
Е. 


CImg 实 例 中 保存 的 可 能 是 二 值 图 像 、 灰 及 图 
像 ， 也 可 能 是 彩色 图 像 。 为 此 可 以 再 次 读 取 
m_PBMIH 中 的 内 容 来 确定 图 像 关 型 。 图 像 信 息 头 
结构 中 的 biBitCount 成 员 保存 了 存储 每 个 像素 使 用 
的 比特 数 ， 由 此 可 以 推测 图 像 的 类 型 。 例 如 ， KE 
图 像 的 biBitCount=8，RGB 图 像 则 为 24， 二 值 图 像 
的 每 个 像 了 只 和 雷 要 一 位 来 保存 ， 因 此 
biBitCount=1.。 


1. Jeda E b! É WJ A z< TÉ 


像 系 操作 算法 的 第 一 步 一 定 古 需要 提取 指定 位 
首 像 系 的 数值 。CImg 类 中 所 取 像 系 值 的 廊 法 为 





GetPixel0 函 数 


GetPixel， 这 个 方法 可 以 目 动 确定 CImg 类 中 保存 的 
图 像 的 类 型 ， 并 根据 不 同类 型 返回 图 像 数据 和 滤 阵 中 
的 对 应 元 素 。 其 中 返回 类 型 COLORREF 是 DWORD 
的 一 个 别名 ， 用 于 保存 赢 色 数 据 。 了 水 数 的 输入 参数 
МАЕ Јх , у 坐标 ， 而 输出 量 是 (x,y) 位 
置 像 际 的 赢 色 。 由 于 要 兼容 多 种 类 型 的 图 像 ， 上 所 以 
使 用 了 兼容 性 最 强 的 返回 类 型 ， 即 COLORREF， 对 
于 灰 度 网 像 ， 将 返回 一 个 在 R、G、B 三 个 分 量 上 相 
等 的 COLORREF 数 据 。 


GetPixel 函 数 的 原型 如 下 。 


РТ ЕЕ ЕЕЕ КЕ БЕЛЕЕ ЕЕЕ ЕЕЕ ЕЕЕ КЕЕ КОЕ КОК ЖОЕ ЕЕЕ ЕЕ ЕЕЕ 
inline COLORREF CImg::GetPixel(int x, int y) 

功能 : 返回 指定 坐标 位 置 像素 的 闫 色 值 

参数 : int x, int у: 指定 的 像 系 横 、 纵 坐标 但 


返回 值 : COLERREF 类 型 : 返回 用 RGB 形式 表示 的 指定 位 置 的 颜色 值 


be 


inline COLORREF CImg::GetPixel(int x, int y) 








2. ВЕНЕ А ПУ ИН 


ТЕЛЕ НЧ СегРіхе 7 19 l 18, ЭТИЕМ 
理 后 ， 算 法 输出 仍然 需要 与 回 到 图 像 数 据 区 中 。 为 
此 ， 也 需要 一 个 按 保 系 绘 图 的 方法 。CImg 类 中 实现 
这 一 功能 的 算法 是 SetPixel， 调 用 时 除了 应 提供 (x， 
y ) 位 置 的 参数 外 ， 还 应 当 包 括 欲 与 入 指定 像 系 位 置 


SetPixel0 函 数 


1СОТ.ОЕВЕКЕЕЕ5Я д FF, 205 gray 
入 灰 度 图 像 时 ， 第 3 个 参数 可 设置 为 RGB(gray, gray, 
отау). 


SetPixel 方 法 的 原型 如 下 。 


A 


void CImg: :SetPpixel(int x, int y, COLORREF color) 
功能 : 设 定 指定 坐标 位 置 像 系 的 闫 色 值 
参数 : int x, int у: 指定 的 像 系 模 、 纵 坐标 值 


COLORREF: 欲 设 定 的 指定 位 置 的 闫 色 值 ，RGB 形 式 给 出 
返回 值 : 无 


下 


void CImg::SetPixel(int x, int y, COLORREF color) 





3. eH TB E r PL HJ Zk ВИН GetGray( 函 数 

由 于 更 多 的 时 候 是 在 处 理 灰 上 腻 图 像 ， 为 方便 调 
用 ，CImg 类 还 提供 了 GetGray 方 法 用 于 生 接 话 入 图 
像 中 (x , у) А А MAKEME, ЗЕД К. 








ОИ ИВО ЕЕЕ УЕ ЕРО ИЕ ИОА EE 


inline ВҮТЕ CImg::GetGray(int х, int у) 

功能 : 返回 指定 坐标 位 置 像素 的 灰 度 值 

限制 | : 2С 

参数 : int x, int у: HEMBRA, IEEE 

返回 值 : BYTE 类 型 : 给 定 像素 位 置 的 灰 度 值 
ООРОО ЕРИ XS us EET] 


inline ВҮТЕ CImg::GetGray(int х, int у) 
{ 


COLORREF ref = GetPixel(x, y); 
BYTE г, g, b, byte; 

// ЗЗКИ ж 
GetRValue(ref); 
GetGValue(ref); 
GetBValue(ref); 


r 
5 
р 


if(r == g && r == b) 
return r; 
float ff = (0.30*г + 0.59*g + 0.11*b); 
// REM 
byte = (int)ff; 
return byte; 





S сар 


CImg 中 的 一 系列 像素 存 取 方 法 ， 如 GetGray，SetPixel 等 要 求 的 参 
数 X，y 分 别 为 像素 位 置 的 模 、 纵 坐标 。 而 横 坐 标 对 应 于 图 像 的 列 索 引 
j， 纵 坐标 对 应 看 图 保 的 行 索 引 i， 因 此 在 逐 行 远 历 图 像 的 程序 段 中 的 调 
用 方式 为 : SetPixel(j, i,...)， 其 体 方法 读者 可 参考 和 后 介绍 的 InitPixels 
Ле 


2.3.5 УКУМ 


有 了 时 需要 改变 已 经 存在 的 CImg 对 象 的 大 小 。 
此 时 ， 除 了 要 对 图 像 信 息 头 进行 相应 更 新 外 ， 还 要 
重新 分 配 一 个 合适 六 小 的 数据 存储 区 ， 当 然 在 此 之 
前 应 释放 旧 的 存储 区 。ImResize 方 法 用 于 实现 这 一 
功能 。 请 注意 ，ImResize 函 数 在 改变 网 像 大 小 的 同 
时 会 欣 除 图 像 中 所 有 的 数据 ， 与 第 4 章 儿 何 杰 换 中 


J = >J PJJ ЖИЛЕ] Scale K Л 7 ! 


J YE OSCE O F E TT TO а 
void CImg::ImResize(int nHeight, int nWidth) 
功能 : 用 给 定 的 大 小 重新 初始 化 CImg 对 象 
PEJE CImg 对 象 必 须 已 经 包含 有 效 的 图 像 数 据 ， 含 则 将 出 销 
参数 : int nHeight: 重新 初始 化 成 的 宽度 
int nWidth: 重新 初始 化 成 的 高 度 

BEHE: Ж 
人 
void CImg::ImResize(int nHeight, int nWidth) 
{ 

int i; // 人 循环 变量 

// 释 放 图 像 数 据 空间 

for(i=0; і<т pBMIH->biHeight; i++) 

{ 

delete[] m Ірра+а[і]; 


J 
delete[ | m lpData; 


// 更 新 信息 头 中 的 相应 内 容 
m pBMIH->biHeight = nHeight; // 更 新 高 度 
m_pBMIH->biwidth = nWidth; // 更 新 宽度 


// 重 新 分 配 数据 空间 

т Ірра+а = new LPBYTE [nHeight]; 

int nWidthBytes = WIDTHBYTES((m _pBMIH->biWidth)*m p 
BMIH->biBitCount); 

for(i=0; i<nHeight; i++) 

l 

т lpData[i] = new BYTE [nWidthBytes]; 
J 


2.3.6 ” 重 载 的 运算 符 


和 MATLAB 不 同 ，C++ 不 是 专门 为 了 科学 计算 
或 者 图 像 处 理 设 计 的 语言 ， 因 而 C++ 中 的 运算 符 在 
没有 重 载 时 是 无 法 接受 图 像 息 阵 作为 运算 参数 的 。 
为 了 后 面 操作 的 方便 ， 对 一 些 图 像 处 理 中 常用 的 运 
算 符 进 行 了 重 载 。 目 前 已 经 提供 重 载 的 运算 符 如 
F. 


operator = (CImg& gray); // 图 像 赋值 

operator = = (CImg& gray); // 判 新 2 幅 图 像 是 售 相 同 
operator & (CImg& gray); // 图 像 按 位 与 

operator | (CImg& gray); // 图 像 按 位 或 


operator + (CImg gray); // 图 像 相 加 
operator - (CImg& gray); // 图 像 减法 
operator ! (); // 图 像 反 色 





TERE T IME, HIIS ARI KMA 
RRM, RKA, KE 6, 1 PLA HJ ER НЕ - 
在 这 个 基础 上 ， 束 可 以 方便 地 使 用 类 似 MATLAB 中 
的 语法 对 CImg 类 的 实例 进行 像素 级 操作 。 运 算 符 重 
载 的 实现 过 程 是 根据 图 像 操作 的 需要 进行 的 ， 其 实 
ЉОЕ ВЕ Вос СЕ 
№) 进行 操作 。 


2.3.7 在 屏幕 上 绘制 位 图 图 像 


ААН ДЧ ВЮ 21е К, АРД 
5 АРЕН ВСЯ. ЕМЕС, Пт ЗЕ а Н. 
А, Wim eK Ze | ПРСТ Б. БШ) 
Draw 方 法 可 以 将 CImg 图 像 对 象 绘制 到 pDC 指 定 的 
FHE, KIU F- 


人 
BOOL CImg: :Draw(CDC# pDC) 

功能 : 在 给 定 的 设备 上 下 文 环境 中 将 CImg 对 象 中 存储 的 图 像 绘制 
|В Б 

БЕ: 无 

参数 : CDC * ррс : 指定 的 设备 上 下 文 环境 的 指针 

返回 值 : ”BOOL 类 型 TRUE 为 成 功 ，FALSE 为 失败 
和 


BOOL CImg: :Draw(CDC# pDC) 


if(m_pBMIH == NULL) 
return FALSE; 


for(int i=0; і<т pBMIH->biHeight; i++) 
{ 


: :SetDIBitsToDevice(*pDC, ©, ©, m pBMIH->biWidth, 
m pBMIH->biHeight, Ө, ©, i, 1, m lpData[i], (BIT 
МАРІМЕО*) т pBMIH, DIB RGB COLORS); 
J 


return TRUE; 





上 述 程序 中 调用 了 了 API 函数 


SetDIBitsToDevice, 13 i žU H DIBI ТЕ, 27 
Jax] E; H in wa RR e ERIH E Ma АЈ 
像素 进行 设置 。 


2.3.8 ERZ 


БТ ЖЕ BMA HI SE Ji е Т6 — Соар НУ KA 
АНИ ИИ EKA BATE C rH ВРАЧ Я. 





ff э ЖЕ НУЛА Н, Cime Ул РА 153952 011] mE 
仅仅 构造 一 个 衬 的 CImg 实 例 ， 其 中 的 所 有 成 员 指 针 都 指 同 NULL， 
此 ， 务 必 在 构造 函数 初始 化 之 后 加 入 其 成 员 的 构造 与 初始 化 ， 以 免 引 
用 无 效 内 存 。 一 种 简便 的 做 法 是 通过 AttachFromFileO 国 数 将 空 CImg 对 
象 和 一 个 读 入 的 图 像 文件 联系 在 一 起 。 


1. 构造 空 的 CImg 对 象 


CIm ME RRR E, EAD REI 
仅 是 将 图 像 信 息 头 、 图 像 数据 区 和 凑 色 索引 表 的 指 
针 指 同 NULL， 从 而 构造 一 个 空 的 CImg 对 象 。 其 实 
现代 码 如 下 。 





CImg: :CImg() 


m рВМІН = NULL; 
m lpvColorTable = NULL; 
m Ірра+а = NULL; 

} 


| 
2. 构造 位 图 信息 类 

在 得 到 一 个 空 的 CImg 实 例 后 ， 自 先 构 迄 位 图 
信息 头 ， 并 按 要 求 议 症 图 像 的 宽度 和 高 度 以 及 候 系 
位 数 等 属性 。 其 实现 代 但 如 下 。 


m_pBMIH = пем BITMAPINFOHEADER ; 


// 也 可 以 在 这 里 设置 其 他 的 图 像 信息 属性 
m pBMIH->biBitCount = imgBitCount; 


m pBMIH->biHeight = imgHeight; 
m pBMIH->biWidth = imgWidth; 





IFE) Y zeae A А а, BAT Н 
ХЕ КЖ, Тйл] Б а Уи КЖ ТЇ 
х. 


3. АСРИ Й < 


图 像 存 储 区 是 一 个 BYTE 型 的 数组 ， 可 以 使 用 
如 下 的 方式 手动 分 配 空间 。 





т Ірра+а = new LPBYTE [imgHeight |; 

int imgWidthBytes = WIDTHBYTES((m pBMIH->biWidth)*m рвм 
IH->biBitCount); 

int 1; 


for(i=0; i<imgHeight; i++) 


m lpData[i] = new BYTE [imgWidthBytes |; 





4. 初始 化 图 像 数 据 一 一 InitPixels(0) 函 数 


上 一 步 中 得 到 的 图 像 数 据 区 属于 新 分 配 的 动态 
内 存 ， 其 内 容 并 不 确定 。 为 了 得 到 有 意义 的 图 像 数 
据 ， 就 需要 使 用 InitPixels 函 数 来 初始 化 每 个 像素 为 
一 个 特定 的 值 。 为 安全 起 见 ， fE E IE 5] [@ ж ЖЕ EA 
{тА ЕЕ 2 BU, Мт Ж er xk АМЕ [ЕВ Ж 
性 ， 即 判断 数据 指 和 针 是 人 否 为 NULL。 


站 下 
void CImg::InitPixels(BYTE color) 
功能 : 用 给 定 的 闫 色 什 初始 化 图 像 的 所 有 像 系 
PEJE 只 能 使 用 灰 度 值 提供 颜色 值 ， 即 只 能 初始 化 为 某 种 灰色 
参数 : BYTE color : 指定 的 用 来 初始 化 图 像 的 灰 度 值 
BEE: Æ 
下 
void CImg::InitPixels(BYTE color) 
{ 

// 345 йт, Ж 

int nHeight = GetHeight(); 

int nWidth = GetWidthPixel(); 


int 主 ，j;// 行 、 列 循环 变量 


// 逐 行 扫描 图 像 ， 依 次 对 每 个 像 系 设置 color 灰 度 
if(m_lpData != NULL) 


for(int i=0; i<GetHeight(); i++) 


for(int j=0; j<GetWidthPixel(); ј++) 


SetPixel(j, i, RGB(color, color, color)); 
}//for j 
}//for i 





2.3.9 ”图 像 类 型 的 判断 与 转化 


很 多 情况 下 ， 图 傈 处 理 算 法 只 能 处 理 东 一 疾 型 
的 图 像 ， 因 此 经 党 需要 在 处 理 之 前 对 图 像 的 类 型 进 
行 判 断 ， 并 在 必要 时 进行 类 型 的 转换 。 下 而 给 出 3 
个 利用 的 舌 型 判 新 和 转换 函数 。 


// 判断 是 否 古 二 值 图 像 
BOOL IsBinaryImg(); 
// Эте тле У 1 
BOOL IsIndexedImg( ) ; 


// 索引 图 像 转 灰 度 图 像 
bool Index2Gray(); 





1 判断 是 合 为 二 人 图 像 效 


ISBinaryImgO 函 数 通 过 二 重 循环 对 图 像 进 行 逐 





IsBinaryIme() 


行 扫描 ， 如 果 发 现任 何 一 个 像素 存在 0O 和 255 之 外 的 
灰 度 值 ， 则 返回 FALSE， 表 示 不 是 二 值 图 像 ; 而 如 
果 所 有 像素 的 灰 度 都 是 0 或 255， 则 返回 TRUE， 表 
示 是 二 值 图 像 。 有 具体 实现 如 下 。 


inline BOOL CImg::IsBinaryImg() 
{ 


int 1,7; 


for(i = 0; i < m_pBMIH->biHeight; i++) 
l 
for(j = 0; j < m_pBMIH->biWidth; j++) 
l 
if( (GetGray(j, i) != Ө) && (GetGray(j, i) != 25 


5) ) // 存 在 9 和 255 之 外 的 灰 度 值 
return FALSE; 
}//for j 
}//for i 


return TRUE; 
J 





2. 判断 是 含 为 索引 图 像 


Islndexedlmg0 РЁ ЖИВ УЧ A pl 6, ж 5] KO Era f. 
在 并 且 表 条 目 不 为 0 来 判断 疼 像 是 否 为 索引 图 像 ， 
具体 实现 如 下 。 


inline BOOL CImg::IsIndexedImg() 
{ 





IsIndexedImg() рќ žk 


if ((m lpvColorTable != NULL)&&(m nColorTableEntrie 
s!=0)) í 


return true; 


else í 
return false; 
J 
J 





3. RI ИК B ——Index2Gray() K Ж 


由 于 大 多 数 图 像 处 理 算法 都 是 针对 灰 度 网 像 
的 ， 因 此 常常 需要 将 彩色 图 像 转 化 为 灰 度 图 像 ， 下 
HEEN Index2Gray0 82% uJ 12566 5| BAF 
102256202 41%, ЖИ €&,.RGB &@ FR MAIK 
РЕ EJ y F ВӘ 2123 & 


Index2Gray0 K 22 BJ FLK ЗЕ ИП F o 





// 索引 图 像 转 灰 度 图 像 
bool CImg: : Іпдех26гау() 


l 


int 1; 


if (!IsIndexedImg()) return false; 
RGBQUAD *table = (RGBQUAD# ) т lpvColorTable; 


m pBMIH->biBitCount = 8; 


// ERE 
for (1=0; i<GetHeight(); i++) 


l 
for (int j=0; j<GetWidthPixel(); j++) 


RGBQUAD rgb = *(table+GetGray(j, i)); 
BYTE gray = rgb.rgbBlue * 0.114 + rgb.rgbGreen * 
0.587 + rgb.rgbRed * 0.299 + 0.5; 
SetPixel(j, i, RGB(gray, gray, gray)); 
J 
J 


// 更 新 颜色 表 
for (1=0; 1<256; i++) 


(table + i)->rgbBlue = i; 

(table + i)->rgbGreen = i; 

(table + i)->rgbRed = 1; 

(table + i)->rgbReserved = ө; 
J 


m nColorTableEntries = 256; 
return true; 


打开 一 幅 256 色 索引 图 像 ， 通 过 采 里 命令 “文件 
-256 色 有 系 引 图 像 欧 为 区 度 图 ?可 以 将 它 转 化 为 灰 度 


О 


24 DIPDemo 工 程 
DIPDemo 工 程 位 于 本 书 配套 光盘 中 的 根 目 录 下 


的 同名 文件 夹 中 ， 它 是 本 书 中 涉及 的 所 有 Visual 

C++ 数 字 图 像 处 理 算法 的 一 个 综合 测试 平台 。 退 过 
它 读 者 可 以 方便 地 查看 多 幅 图 像 ， 退 过 来 蛙 命 令 处 
理 图 像 并 观 罕 效果， 还 可 以 对 同一 幅 图 像 处 理 前 后 
的 效果 进行 对 比 。 本 节 主 要 介绍 DIPDemo 工 程 的 界 
面 、 主 要 框 淋 结构 和 一 些 最 常用 的 基本 功能 ， 时 多 
其 他 的 内 容 将 分 散在 本 书后 面 各 章 世 中 随 需要 来 前 


2.41 DIPDemo 主 界面 


DIPDemo 是 一 个 基于 多 文档 的 Visual C++ 程 
序 ， 运 行 后 主 界面 如 网 2.2 所 示 。 














图 2.2 ”DIPDemo 程 序 主 界面 


通过 末日 命令 “文件 打开 ”打开 一 幅 或 多 幅 
图 像 后 ， 将 会 出 现 如 图 2.3 所 示 的 程序 界面 ， 此 时 便 
可 以 过 过 相应 处 理 来 里 下 的 命令 对 当前 选中 的 图 侵 
进行 需要 的 处 理 。 


二 数字 图 像 处 理 与 机 咒 视 觉 补 步 - baby- bap ЕЕ 
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242 ”图 像 操 作 和 处 理 类 一 -CImg 和 


CImgProcess 


CImg 和 CImgProcess 是 DIPDemo 中 的 两 大 核心 
类 ， 它 们 屑 负 看 几乎 所 有 的 图 像 操作 和 处 理 大 任 。 
2.3 廊 已 经 对 CImg 类 进行 了 比较 全 和 面 的 介绍 ， 这 里 
对 其 派生 类 CImgProcess 做 一 个 简要 的 说 明 。 
CImgProcess 的 类 定义 片断 如 下 ， 可 以 看 到 其 中 封 
泪 了 本 书 中 将 要 出 现 的 绝 大 部 分 图 像 处 理 算法 ， 本 
书 将 在 随后 各 革 中 给 出 这 些 算法 的 原理 和 实现 。 


// CImgProcess 封 荫 了 各 种 图 像 处 理 的 标准 算法 
class CImgProcess : public CImg 
{ 
public: 
CImgProcess(); 
Virtual 一 CImgProcess( ) ; 


J [XXX sk sk sk k k k k k R R R жт 3 童 图像 的 点 运算 六 炒米 炒米 炒米 炒米 炒米 炒米 炒米 炒米 

BOOL GenHist(double * hist, int n = 256);// 生成 灰 度 
和 直方 图 

BOOL ParLinTran(CImgProcess * pTo, BYTE х1, BYTE х2 
，BYTE y1, BYTE y2);// 分 段 线性 变换 

BOOL LinTran(CImgProcess * pTo, double dFa, double 
dFb);// 线 性 变换 

BOOL LogTran(CImgProcess * pTo, double C);// 对 数 变 换 

BOOL GammaTran(CImgProcess * pTo, double gamma, dou 
ble сотр=0) ; / / WHA 

BOOL WindowTran(CImgProcess * pTo, BYTE lowThre, BY 
TE highThre);// 窗 口 变换 

BOOL Histeq(CImgProcess * pTo);// 灰 上 度 均衡 化 

BOOL Histst(CImgProcess * pTo, double* pdStdHist);/ 
/直方 图 规定 化 ， 直 接见 配 直方 图 

BOOL Histst(CImgProcess * pTo, CImgProcess* pStd);/ 
/和 直方 图 规定 化 ，[ 匹 配 标 准 图 像 的 直方 图 


J [FXX kk k k k kk k k k k k те Д-тү 8 HI J L Ta] ZU JI * k o= o= ok sk ok ak ak ak ak ak k k жж 
void ImMove(CImgProcess* pTo, int x, int y);// 图 像 平 


void HorMirror(CImgProcess* pTo);// 网 像 水 平 镜 象 

void VerMirror(CImgProcess* рТо); // KB E 61 Ж 

void Transpose(CImgProcess+k рТо); // B2 fk E 

void Scale(CImgProcess* pTo,double times);// 图 像 缩放 
void Rotate(CImgProcess* pTo,float ang);// 图 像 旋转 


y; //class CImgProcess 





243 ”文档 类 一 —CDIPDemoDoc 


DIPDemo 使 用 了 文档 和 视图 分 离 的 结构 ， 文 档 
关中 保存 了 两 个 CImgProcess 类 的 实例 m_Image 和 
m_OImage， 分 别 用 于 保存 当前 时 示 的 前 人 台 图 像 和 
后 台 备 份 的 图 像 ， 此 外 还 提供 了 对 图 像 读 、 写 的 有 
力 文 择 ， 将 在 2.5 节 中 随 示 例 一 起 介绍 。 


以 下 是 DIPDemoDoc 类 定义 中 的 一 段 相 关 代 
ШЙ 


— 


// 对 应 的 CImgProcess 对 象 〈 前 台 显 示 ) 
CImgProcess т _ Image 


// 对 应 的 CImgProcess 对 象 〈 后 台 备 份 ) 


СІтеРгосеѕ5 m OILImage ; 





打开 一 幅 图 像 并 显示 后 ， 它 就 成 为 当前 图 像 ， 在 经 过 算法 处 理 


后 ， 输 出 图 像 将 成 为 前 台 图 像 显示 出 来 ， 但 此 时 原 图 像 并 没有 被 于 
弃 ， 而 是 将 它 保存 在 文档 类 的 后 台 对 象 m_OImage 中 。 用 户 可 以 使 用 文 
件 采 蛙 下 面 的 “与 后 台 图 像 交 换 ” 功 能 或 工具 栏 中 的 251658240# 按钮 随 
时 切换 这 两 幅 图 像 ， 对 图 像 处 理 前 后 的 效果 进行 对 比 。 


2.44 ”视图 类 一 一 CDIPDemoView 


视图 类 提供 了 对 全 部 图 像 处 理 末 时 命令 的 啊 应 
功能 、 客 户 重 绘 功 能 ， 以 及 交换 前 、 后 台 图 像 的 功 
能 。 下 面 给 出 重 绘 事件 OnDraw 和 前 后 台 图 像 交 换 
国 数 OnFileRotate 的 实现 细节 ， 在 2.5 节 中 将 给 出 一 
个 图 像 清空 操作 的 视图 类 啊 应 函数 实例 。 


1， 重 给 事件 的 啊 应 代码 


void CDIPDemoView: :OnDraw(CDC* pDC) 


l 
// REIT GEN 
BeginWaitCursor(); 


// 获取 文档 

CDIPDemoDoc* pDoc = GetDocument(); 
ASSERT VALID(pDoc); 
if(pDoc->m_Image.IsValidate()) 


CPalette* pOldPalette; 
CPalette* pPalette = pDoc->GetDocPalette(); 


if(pPalette!=NULL) 


pOldPalette = pDC->SelectPalette(pPalette, FALSE 


pDC->RealizePalette(); // 更 新 系统 调 色 板 
J 


pDoc->m_Image.Draw(pDC); // 绘 制图 像 


if(pPalette!=NULL) 
pDC->SelectPalette(pOldPalette, FALSE); 


J 
// 恢复 正常 光标 
EndWaitCursor(); 





每 次 客户 区 需要 重 绘 时 ，OnDraw 困 数 都 会 调 
用 文档 类 中 m_Image 对 象 的 Draw 方 法 将 m_Image 对 
象 绘制 到 pDC 指 定 的 平面 上 。 


2. 区 换 前 、 后 全 图 像 的 啊 应 代码 


文件 京 单 下 面 的 “与 后 人 台 图 像 交 换 ?” 功 能 的 啊 应 
图 数 实现 如 下 。 





void CDIPDemoView::OnFileRotate() 


// 切换 前 、 后 台 图 侵 
CDIPDemoDoc * pdoc = GetDocument(); 


але раос->т ОІтаре); // 交 换 前 、 
HO O 


pdoc->SetModifiedFlag(true); 


pdoc->UpdateAllViews(NULL); 
J 


2.5 CImsg 恬 用 示例 


本 节 提 供 一 个 使 用 示例 程序 DIPDemo 进 行 简 早 
图 像 处 理 操作 的 泡 例 ， 对 一 张 示例 图 像 进行 简单 的 
清空 操作 ( 置 日 ) 。 这 可 以 通过 以 参数 255 调 用 
CImg 类 中 的 儿 像 数据 初始 化 方法 InitPixelsO 来 实 
现 。 旋 者 在 疯 谈 过 程 中 ， 除 注意 程序 框架 结构 的 基 
本 使 用 方法 外 ， 还 应 对 2.5.3 小 节 InitPixels0 函 数 基 
于 逐 行 扫描 像素 的 网 像 处 理 算法 的 实现 方式 建立 一 
个 基本 的 认识 。 


2.51 打开 图 像 


可 以 退 过 采 蛙 命令 “文件 打开 ”来 打开 需要 清 
空 有 办 图 像 ， 如 图 2.4 所 示 。 


文档 类 的 OnOpenDocument() 方 法 用 于 啊 应 打开 
文件 的 菜单 消息 ， 该 方法 调用 了 CImg 的 图 像 文件 读 
取 方 法 AttachFromFile()。 下 面 给 出 
OnOpenDocumentO0 方 法 的 实现 代码 。 























Боле оао тат ленно жанас 
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624 打开 文件 





BOOL CDIPDemoDoc: :OnOpenDocument(LPCTSTR LpszPathName ) 
{ 


DeleteContents(); 


// 更 改 光 标 形 状 


BeginWaitCursor(); 


// 读 取 图 像 并 附加 到 m_Image 上 
if(!m Image.AttachFromFile(1pszPathName)) 


{ 
EndWaitCursor(); 


AfxMessageBox(" 打 开 文 件 时 出 错 1! 请 确 你 正确 的 位 图 (*.bmp 


) 文 件 类 型 。 " ) ; 
return FALSE ; 
J 


// 恢复 光标 形状 
EndWaitCursor(); 

// FERA A 

if (!m Image.m lpData) 


l 
// 失败 ， 可 能 非 BMP 格 式 
CString strMsg; 
strMsg = "БЕЙХАКИ Н! 可 能 古 不 文 持 该 类 型 的 图 像 文件 


// бух НН 
МеѕѕареВох (МОЕ, strMsg, "EZR", МВ ICONINFORM 
ATION | MB OK); 


// 返回 FALSE 
return FALSE; 


} 
Init(); // 对 疼 像 的 大 寸 和 调 色 板 信息 进行 初始 化 


// 设置 文件 名 称 
SetPathName(lpszPathName); 


// 复制 当前 m_Image 到 m_OImage 
m Olmage = т Image; 


// 初始 化 脏 标 记 为 FALSE 
SetModifiedFlag(FALSE); 


// 返回 TRUE 


return TRUE; 
J 


2.5.2 W T BNS 


g: КЖ, ЛЯ т < СЇР ~ 清空 图 像 ? 对 图 
像 执 行 清 空 操作 ， 清 空 后 效果 如 图 2.5 所 示 。 


在 “清空 图 像 ” 玉 持 啊 应 疯 数 OnFileClean() 中 ， 
自 先 要 取得 2.5.1 小 廊 中 读 入 的 图 像 对 象 ， 并 将 它 你 
存在 CImgProcess 类 的 临时 对 象 imgInput 中 ; 接着 需 
通过 检查 imgInput.m_pBMIH->biBit- Count 的 值 以 确 
保 图 像 是 程序 可 以 处 理 的 8-bpp 图 像 ， 而 后 以 参数 
255 调 用 CImg 类 的 InitPixelsO 函 数 来 完成 实际 的 图 像 
清空 操作 ;最 后 再 将 处 理 后 的 图 像 返回 给 文档 类 ， 
从 而 更 新 了 实际 的 图 像 对 象 。 


) 图像 增强 中 ”形态 学 变 找 (M 
图 像 处 理 (C е0 ен [elx] 


s; l| 2 ma |o | t| 





图 2.5 ”清空 后 的 图 像 
OnFileClean(0) 函 数 的 实现 代码 如 下 。 





void CDIPDemoView: :OnFileClean() 
{ 


// 获取 文档 对 象 
CDIPDemoDoc* pDoc = GetDocument( ) ; 


// 输入 对 和 象 


CImgProcess imglnput = pDoc->m Image; 


// W е К K 
if (imgInput.m pBMIH->biBitCount!=8) 


АҒхМеѕѕареВох (" 158-Ьрр2х E 18, А! "); 
return; 


} 


imgInput.InitPixels(255);// TBA Сан) 
// 将 结果 返回 给 文档 类 

pDoc->m Image = imgInput; 

// 设置 脏 标 志 

pDoc->SetModifiedFlag(true); 

// 设置 客 忆 区域 无 效 ， 激 友 重 绘 事件 
pDoc->UpdateAllViews(NULL); 


253 ZRU YE 

初始 化 方法 InitPixelsO 是 清空 操作 的 核心 ， 相 
当 于 一 个 简单 的 网 像 处 理 算 法 。 程 序 中 以 逐 行 扫描 
的 方式 ， 依 次 对 每 个 像 际 的 灰 度 进行 设置 ， 这 对 应 
于 代码 中 的 二 重 for 循 环 部 分 。 今 后 将 要 学 习 的 很 多 
图 像 处理 算 法 都 是 基于 这 种 逐 行 扫 摘 的 基本 结构 。 


InitPixelsO 函 数 的 实现 代码 如 下 。 


а оо оа 
void CImg::InitPixels(BYTE color) 


功能 : 用 给 定 的 颜色 信 初 始 化 图 像 的 所 有 像素 
PEJE 只 能 使 用 灰 度 值 提供 颜色 值 ， 即 只 能 初始 化 为 某 种 灰色 
参数 : BYTE color: 指定 的 用 来 初始 化 图 像 的 灰 度 值 
BEE: 无 
оаа а 
void CImg::InitPixels(BYTE color) 
l 

// 345 FA a s Ж 

int nHeight = GetHeight(); 

int nWidth = GetWidthPixel(); 


int i, j; // 行 、 列 循环 变量 
if(m_lpData != NULL) 


l 
[DEITAR R, KRR BE A color E 
for(int i=0; i<GetHeight(); i++) 


for(int j=0; j<GetWidthPixel(); j++) 
SetPixel(j, i, RGB(color, color, color)); 
}//for j 


}//for i 
J 


25.4 ІЖ 


最 后 通过 菜单 命令 "文件 ~ 保存 ”将 处 理 后 的 图 
像 保 存 到 磁盘 。 


体 存 文件 的 菜单 的 啊 应 函数 OnSaveDocument() 


ШУ ИКИ К. 


BOOL СОІРреторос: :OnSaveDocument(LPCTSTR 1рѕ2РаћМате ) 


if(!m Image.SaveToFile(lpszPathName)) 


l 
CString strMsg; 


strMsg = “无 法 保存 BMP 图 像 ! "; 


// уН 

MessageBox(NULL, strMsg, "系统 提示 "，MB_ICONINFORM 
ATION | MB OK); 

return FALSE; 


J 
// 恢复 光标 形状 
EndWaitCursor(); 


// 重症 脏 标 志 为 FALSE 
SetModifiedFlag(FALSE); 


return TRUE; 
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对 于 一 个 数字 图 像 处 理 系统 来 襄 ， 一 般 可 以 将 
处 理 流程 分 为 3 个 阶段 。 在 获取 原始 图 像 后 ， 自 先 
是 图 像 预 处 理 阶段 ， 第 二 是 特征 抽取 阶段 ， 最 后 才 
是 识别 分 析 阶 段 。 预 处 理 阶段 尤为 重要 ， 这 个 阶段 
处 理 不 好 则 后 面 的 工作 根本 无 法 展开 。 


上 护 运 算 指 的 是 对 图 像 中 的 每 个 像 系 依 钦 进行 同 
样 的 灰 度 变换 运算 。 议 rr 和 s 分 别 是 输入 图 像 f (х,у) 
和 输出 图 像 g (х,у ) 在 任 一 点 (x,y ) 的 灰 度 值 ， 则 点 运 
a LEH FRE X. 


s=T (r) 
(3-1) 


其 中 , ТАЖНА 7, RI Y ERUR 
BAAR E | Z H IRPA E НО] Ж: Z < 


кА P e H TAE RAHI ZAKE ТЫ E Л 2 4l1 , 
是 图 像 数 字 化 及 图 像 显示 时 常常 需要 的 工具 。 点 运 
算 因 其 作用 的 性 质 有 时 也 被 称 为 对 比 度 由 增强 、 
对 比 度 拉 伸 或 灰 肛 变换 。 


本 章 的 知识 和 技术 热点 
(1) 最 基本 的 图 像 分 析 工 具 _ REANA 
(2) 利用 直方 图 辅助 实现 的 各 种 灰 度 变换 ， 
包括 灰 度 线性 变换 、 灰 度 对 数 变换 、 伽 玛 变换 、 阅 
值 变换 和 窗口 变换 等 


(3) 两 种 实用 的 卫 方 图 修正 技术 一 一 耳 方 图 
均衡 化 和 年 方 图 规定 化 


本 章 的 典型 案例 分 析 
(1) 基于 直方 图 均衡 化 的 图 像 灰 度 归 一 化 
(2) 和 卫 方 图 匹配 
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灰 度 直方 图 描述 了 一 幅 图 像 的 灰 度 级 统计 信 
息 ， 主 要 应 用 于 图 像 分 割 和 图 像 灰 度 变换 等 处 理 过 


3.1.1 理论 基础 
MZ EXW, BBEAN KHIR ERANA 


个 灰 度 级 的 统计 特性 ， 它 是 图 像 灰 度 值 的 函数 ， 
计 一 幅 图 像 中 各 个 灰 度 级 出 现 的 次 数 或 概率 。 А. 
种 特殊 的 直方 图 叫 作 归 一 化 直方 图 ， 可 以 直接 反映 
不 同 灰 度 级 出 现 的 比率 。 


从 图 形 上 来 说 ， 灰 度 直 方 图 是 一 个 二 维 图 ， 械 
坐标 为 图 像 中 各 个 像 系 后 的 灰 度 级 别 ， 纵 坐标 表示 
ананан 


提示 


如 不 特别 说 明 ， 本 书 中 的 耳 方 图 的 纵 坐 标 都 对 应 看 该 灰 度 级 别 在 
图 像 中 出 现 的 次 数 ， 而 归 一 化 耳 方 图 的 纵 坐 标 则 对 应 看 该 灰 度 级 列 在 
图 像 中 出 现 的 概率 。 


灰 肥 下方 图 的 计算 是 根据 其 统计 定义 进行 的 。 
镜像 的 灰 度 百 方 匈 是 一 个 离散 函数 ， 它 表示 图 像 每 
一 灰 度 级 与 该 灰 度 级 出 现 频 率 的 对 应 关系 。 假 该 一 
昼 图 像 的 像 系 忌 数 为 N， 灰 度 级 总 数 为 上 站， 其 中 灰 
度 级 为 g 的 像素 总 数 为 Ny ， 则 这 幅 数字 图 像 的 灰 度 
直方 图 横 坐 标 即 为 灰 度 g (0<g <L 一 1) ， 纵 坐标 
则 为 灰 度 值 出 现 的 次 数 N, 。 实 际 上 ， 用 像素 总 数 N 
去 除 以 各 个 灰 度 信 出 现 的 次 数 No 即 得 到 各 个 灰 度 
级 出 现 的 概率 P。 = Ng /N =No /ZN ， 从 而 得 到 归 一 
化 的 灰 度 直方 图 ， 其 纵 坐 标 为 概率 P 。 


31.2 MATLAB 实 现 


MATLAB 中 的 imhist 函 数 可 以 进行 儿 像 的 灰 度 
直方 图 运算 ， 调 用 语法 如 下 。 


imhist(I) 
imhist(I, n) 


[counts,x] = imhist(...) 





参数 说 明 : 


° Тут И K B£ El 77 s| BENA: 

° 0 为 指定 的 灰 度 级 数目 ， 如 末 指 定 参 数 n， 则 会 
将 所 有 的 灰 度 级 均匀 分 布 在 n 个 小 区 间 内 ， 而 不 
征 将 所 有 的 艾 度 级 全 部 分 开 。 


Jx ЗИВ: 
• couts 5AN Ё 038 [0] 8, соцпіѕ(1) 275 ВТ Ж 


БЕ АНИК H ; 
° XIE КА S X| J ke s [н] HS E E o 


АННУ В А“ РА 38725 E, M ел 
ЁЛ ЁЇ; 在 得 到 这 些 返 回 数 据 之 后 ， 也 可 以 使 用 
stem(x, counts) 来 手工 绘制 直方 网 。 


1. 一 般 直 方 图 


下 面 使 用 了 MATLAB 中 的 一 张 内 置 示例 图 厂 演 
示 灰 虐 了 下方 图 的 生成 与 显示 ， 程 序 如 下 。 


I = imread('pout.tif'); % 该 取 图 像 pout .tif 
figure; % 打开 一 个 新 窗口 
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(a) 示例 图 片 pout.tif (b) 灰 度 直方 图 


图 3.1 灰 度 直 方 图 的 生成 
图 3.1 (b) 中 玉 经 归 一 化 的 灰 度 下 方刚 的 纵 轴 表 示 


КНН ТВ В 10 E КЛИН НУК С: 横 轴 
ХЛ JA02I25518 MA ZX B, 18 s 了 uint8 存 储 格 式 
НУК ВЕ A F HJH A n Bé HY {И - 


因为 相近 的 灰 度 值 所 具有 的 含义 往往 是 相似 的 ， 所 
以 党 党 没有 必要 在 每 个 灰 度 级 上 都 进行 统计 。 下 面 
的 命令 将 0 一 255 总 共 256 个 灰 度 级 平均 划分 为 64 个 
长 度 为 4 的 灰 度 区 间 ， 此 时 纵 轴 分 别 统计 每 个 灰 度 
区 间 中 的 像素 在 图 像 中 的 出 现 次 数 。 其 编程 代码 如 
下 。 


imshow(I); title('Source'); % 显示 原 图 像 
figure; % 打开 一 个 新 窗口 


imhist(I); title('" Graph ' ) ; % zF EL J B] 





ЕИ ат ЖИП 3.15. 


imhist(I, 64); % ÆA 647 ЛМХ [HJ BJ Zk Е K 





ERMS ИУ ЖТ 3.28575. 





3.2 ”分 为 64 段 小 区 间 的 灰 度 直方 图 


由 于 要 统计 洛 入 每 个 灰 度 区 间 内 的 像 系数 目 ， 
К) C [B] 26 СЛ З BB PK JW ЕА F ES]3.2 7 
的 直方 图 中 ， 由 于 减少 了 收集 箱 的 数目 ， 使 得 洛 入 
每 个 收集 箱 的 像 系数 目 有 所 增加 ， 从 而 使 是 方 图 更 
具 统 计 特性 。 收 集 箱 的 数目 一 般 设 为 2 的 整数 次 
医 ， 以 你 证 可 以 无 需 圆 整 。 


2. 归 一 化 直方 图 


在 imhist 画 数 的 返回 值 中 ，counts 保 人 存 了 洛 入 每 
个 区 间 的 像 了 系 的 个 数 ， 通 过 计算 counts 与 图 像 中 像 
系 忌 数 的 隔 可 以 得 到 归 一 化 的 直方 图 。 


绘制 有 32 个 灰 肥 区间 的 归 一 化 直方 图 的 
MATLAB 程 序 如 下 。 


I = imread('pout.tif'); % ЛАЛЕ 

figune; % 打开 新 窗口 

[M,N] = Size(I) % 计算 图 像 大 小 

[counts, x] = imhist(I, 32); % 计算 有 32 个 小 区 间 的 灰 度 直 
方 图 


counts = counts / M / N; % 计算 归 一 化 灰 度 直方 图 各 区 间 的 
值 
stem(x, counts); % 绘制 归 一 化 直方 图 





上 述 程序 的 运行 结果 如 图 3.3 所 示 。 
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图 3.3” 归 一 化 直方 图 


分 析 图 像 的 灰 度 卫 方 图 往往 可 以 得 到 很 多 有 效 
的 信息 。 例 如 ， 从 图 3.4 的 一 系列 灰 度 二 方 图 上 ， 可 
以 很 百 观 地 看 出 图 像 的 完 度 和 对 比 度 特征 。 实 际 
上 ， 下 方 图 的 峰值 位 症 说 明了 图 像 总 体 上 的 腕 暗 : 
如 未 图 像 较 涡 ， 则 百 方 多 的 峰 信 出 现在 百 方 独 的 轻 
右 部 分 ; 如 来 图 像 较 瞳 ， 则 和 下方 图 的 峰值 出 现在 耳 
方 匈 的 较 元 部 分 ， 从 而 造成 暗部 细 贡 难以 分 辨 。 如 
朱 百 方 匈 中 只 有 中 间 寺 一 小 段 非 零 值 ， 则 这 张 图 傈 
的 对 比 度 较 低 ， 反之， 如 来 下 方 图 的 非 零 值 分 布 很 


ПП Н. 92552), ШЖ HIX EE REBET o 











(a) 较 上 暗 的 图 像 
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(c) 对 比 度 较 小 的 图 像 
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(d) 对 比 度 较 大 的 图 像 
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EHEZ НАТА, БАВЧА J ЖК 
的 图 像 增 强 方法 进行 处 理 ， 这 些 方法 的 具体 介绍 详 
见 3.7 节 。 


3.1.3 Visual C++ 实现 


可 以 利用 循环 遇 历 图 像 中 的 每 一 个 像 系 ， 并 鬼 
丈 度 值 分 类 ， 以 此 为 依据 素 加 灰 度 值 计 数 角 。 为 了 
得 到 归 一 化 的 直方 图 ， 在 最 后 将 耳 方 图 各 个 级 列 上 
的 数值 除 以 图 像 的 中 面积 即 可 。 


GenHistO 方 法 的 实现 代码 如 下 。 


i 
BOOL CImgProcess::GenHist(double * pdHist, int n) 
功能 : 生成 图 像 的 灰 度 直方 图 
参数 : double * pdHist: 输出 的 灰 度 直方 图 数组 
BYTE n: 灰 度 直方 图 的 灰 度 级 数 《〈 段 数 ) 

返回 值 : ”BOOL 类 型 ，true 为 成 功 ，false 为 失败 
和 
BOOL CImgProcess: :GenHist(double * pdHist, int п) 
l 

// 首先 检查 图 像 的 类 型 

if (m pBMIH->biBitCount!=8) return false; 


// 检查 n 范 围 
if ((n<=0)||(n>256)) return false; 


// 计算 分 段 因 子 
double dDivider; 


memset(pdHist, ©, п * sizeof(double)); 
dDivider = 256.0 / (double)n; 


BYTE bGray; // 临时 变量 ,存储 当前 光标 像 系 的 灰 度 人 
for (int i=0; i< m pBMIH->biHeight; i++) 


for (int j=0; ј<т pBMIH->biWidth; j++) 


bGray = GetGray(j, i); 
pdHist[(int)(bGray / dDivider)]++; // FEWE K 
ЇН] Н ЛП 
J 
J 


UINT square = m pBMIH->biWidth * т pBMIH->biHeight; 
for (int k=0; k<n; k++) 


pdHist[k]=pdHist[k]/square; 
J 


return true; 


利用 GenHistO 函 数 生 成 灰 及 下 方 图 的 完整 示例 
025127 рІРрето Т НЧА 2 A уоіа 
CDIPDemoView::OnViewIntensity() 中 ， 由 于 这 古本 
书 中 的 第 一 个 利用 我 们 的 程序 包 进 行 编 程 的 例子 ， 


所 以 下 面 给 出 了 OnViewIntensity0 的 完整 实现 。 


void CDIPDemoView: :OnViewIntensity'( ) 


l 
// Ва EL J K 


// 获取 文档 
CDIPDemoDoc* pDoc = GetDocument( ) ; 


// 输入 对 象 


CImgProcess ітеІприї = pDoc->m Image; 


// 和 直方 图 数组 
double hist[256]; 


// 设置 忙 状态 


BeginWaitCursor(); 


// ЕА 3528 
imgInput.GenHist(hist); 


CDlgHist dlg; 
dlg.m pdHist = hist; 


if (dlg.DoModal() != IDOK) 
// 返回 
return; 


) 


// SH SALES 
pDoc->UpdateAllViews(NULL); 


/ 恢复 光标 
EndWaitCursor(); 


'” o 
者 可 以 通过 光盘 示例 枉 序 DIPDemo 中 ШЕ! 
售 令 “所 运算 一 灰 度 直方 图 ?来 观察 处 理 效 末 ， 如 3.5 


у 
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АзЗ5 ЖЕНУ 64 2 H. 
3.2 ЖУН) PEZ F 
3.21 理论 基础 


线性 灰 皮 变换 函数 f(x ) 古 一 个 一 维 线性 函数 。 


Dp = [(DA ) = fa Da + [в 
( 3-2 ) 


AH, Sifa ZJZ EER ЕЈ, fp ARTEK 
数 在 y ЯЛ, Da 表示 输入 图 像 的 灰 度 ，DBp K 
示 输 出 图 像 的 灰 度 。 


• “fa > 1 时 ， 输 出 图 像 的 对 比 度 将 增 大 ; “д <1 
时 ， 输 出 图 像 的 对 比 度 将 减 小 。 

当 f =1 且 fp 关 0 时 ， 操 作 仅 使 所 有 的 像 孙 的 灰 度 
值 上 移 或 下 移 ， 其 效果 是 使 整个 图 像 更 蜡 或 更 
>u; А <0, РЕ, [Хх ЖЖ ЗЕ. 
D hh 2 ГИ u БЕ ЈАР п ВЕ H РИ А 
PNA (小 于 0 或 超过 255) 从 而 丢失 一 部 分 细 
T° 

特殊 情 况 下 ， 当 有 =1， 户 =0 时 ， 输 出 图 傈 与 答 
入 图 像 相同 ， 当 f = -1， 户 =255 时 ， 输 出 图 像 的 
灰 度 正好 反 转 。 灰 度 反 转 处 理 适 用 于 增强 蜡 色 
图 像 中 的 腕 度 较 大 的 细 贡 部 分 ， 这 也 是 由 人 的 
视觉 特性 决定 的 。 


线性 变换 的 示意 图 如 图 3.6 所 示 。 


稍 后 的 MATLAB 实 现 中 将 分 别 给 出 对 应 于 上 述 


这 些 情况 的 变换 实例 。 


F,=2, F,=-55, 增加 对 比 度 F,=0.5, F,=-55, 减 小 对 比 度 F,=1, F,=55, 线性 平移 增加 亮度 F—1, Е„=255, 反 相 显示 
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3.6 ”线性 变换 示意 网 
3.22 MATLAB 程 序 的 实现 
使 用 MATLAB 对 图 像 执 行 线 性 变换 无 需 专 门 的 
函数 ， 下 面 的 程序 对 MATLAB 示 例 图 像 coins.jpg 进 
行 了 不 同 参 数 的 线性 变换 操作 。 其 编程 代码 如 下 。 


I = imread('coins.png'); % ЛЛ И 


І = im2double(I); % 转换 数据 类 型 为 double 

[M,N] = size(1); % 计算 网 像 面 积 

figure(1); % 打开 新 窗口 

imshow(I); % 显示 原 图 像 

title(' 原 图 像 ' ) ; 

figure(2); % 打开 新 窗口 

[H,x] = imhist(I, 64); % 647/1 [H] BJ Jk 2 El. Л K 


stem(x, (H/M/N), '.'); % 显示 原 图 像 的 直方 图 
title(' 原 图 像 '); 


% 增加 对 比 度 


Ра = 2; Fb = -55; 
О = Fa .* І + ЕЫ/255; 


Ғівиге(3); 

ѕибр10+1(2,2,1); 

imshow(O ) ; 

title('Fa = 2 Fb = -55 增加 对 比 度 ' ) ; 


figure(4); 

subplot(2,2,1); 

[H,x] = imhist(O, 64); 

stem(x, (H/M/N), '.'); 

title('Fa = 2 Fb = -55 增加 对 比 度 '); 


% 减 小 对 比 度 
Fa = 0.5; ЕБ = -55; 
О = Fa .* І + Fb/255; 


figure(3); 

subplot(2,2,2); 

imshow(O ) ; 

title('Fa = 0.5 Fb = -55 减 小 对 比 度 '); 


figure(4); 

subplot(2,2,2); 

[H,x] = imhist(O, 64); 

stem(x, (H/M/N), '.'); 

title('Fa = 0.5 Fb = -55 减 小 对 比 度 '); 


% 线性 增加 亮度 
Fa = 1; FD = 55; 
О = Еа .* I + Fb/255; 


figure(3); 
subplot(2,2,3); 
imshow(O ) ; 


title('Fa = 1 Fb = 55 线性 平移 增加 亮度 ' ) ; 


figure(4); 

subplot(2,2,3); 

[H,x] = imhist(O, 64); 

stem(x, (H/M/N), '.'); 

title('Fa = 1 Fb = 55 线性 平移 增加 亮度 ' ) ; 


% 肥 相 显示 
Fa = -1; Fb = 255; 
О = Fa .* I + Fb/255; 


figure(3); 

subplot(2,2,4); 

imshow(O ) ; 

title('Fa = -1 Fb = 255 反 相 显示 '); 


figure(4); 

subplot(2,2,4); 

[H,x] = imhist(O, 64); 

stem(x, (H/M/N), '.'); 

title('Fa = -1 Fb = 255 反 相 显示 '); 


上 述 程序 存放 在 c3s1.m 文 件 中 ， 其 运行 结果 如 
图 3.7 所 示 。 





(a) 示例 图 像 coins.png 
F, = 2 F, = —55 增加 对 比 度 Е, = 0.5 F, = 一 55 减 小 对 比 度 





F, = 一 1 F,=255 反 相 显示 





(b) 线性 变换 对 图 像 的 影响 


原 图 像 
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(c) 原 图 像 的 灰 度 直方 图 
F,=2F,=-55 增加 对 比 度 F, = 0.5 Е, =—55 减 小 对 比 度 
0.4 0.8 
0.3 0.6 
0.2 0.4 
0.1 0.2 
0 0 
0 0.5 | 0 0.5 l 
F, = 1 F, = 55 线性 平移 增加 亮度 Е,=-1 Е, = 255 反 相 显示 


0.2 0.4 
0.15 0.3 
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(d) 线性 变换 对 灰 度 直方 图 的 影响 


— 


3.7 ”线性 变换 实例 说 明 


从 图 3.7 可 以 看 出 : 改变 图 像 的 对 比 度 是 对 有 下方 
RWAF, MERRER R E FEN 
ре ПАН «ЖЕ 77 КР 
Ж. 


单纯 的 线性 灰 度 变换 可 以 在 一 定 程度 上 解决 视 
说 上 的 图 像 整 体 对 比 度 问 题 ， 但 是 对 图 像 细 节 部 分 
的 增强 则 较为 有 限 ， 结 合 后 面 将 要 介绍 的 非 线 性 变 
换 技 术 可 以 解决 这 一 问题 。 
3.2.3 Visual C++ 实现 


使 用 Visual C++ 实现 线性 变换 的 代 但 如 下 。 





六 


BOOL CImgProcess::LinTran(CImgProcess* pTo, double dFa， 
double dFb) 
功能 : 图 像 的 线性 变换 方法 
参数 : CImgProcess * pTo: 输出 CImgProcess 对 象 的 指针 
double dFa: 线性 变换 斜率 
double dFb: 线性 变换 截 距 
BEHE: ”BOO0L 类 型 ，true 为 成 功 ，false 为 失败 
人 
BOOL CImgProcess::LinTran(CImgProcess* pTo, double dFa， 
double dFb) 


l 
// 首先 检查 图 像 是 否 是 8 位 灰 度 图 像 


if (m pBMIH->biBitCount!=8) return false; 


BYTE gray; // 临时 变量 ,存储 当前 光标 像素 的 灰 度 值 
int target; // 临时 变量 ,存储 当前 光标 像素 的 目标 值 


for (int i=0; і<т pBMIH->biHeight; i++) 


l 
for (int j=0; j<m_ pBMIH->biWidth; j++) 


{ 
gray = GetGray(j, i); 


target = dFa * gray + dFb; 
if (target < Ө) target = ө; 


if (target > 255) target = 255; 


// 写 入 目标 图 像 
pTo->SetPixel(j, i, RGB(target, target, target)); 
J 
J; 


return true; 


} 


利用 LinTran0 函 数 实 现 灰 度 线 性 变换 的 完整 示 
例 被 封 狼 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView::OnPointLiner() 中 ， 其 中 调用 
LinTran( K ZAJRA АТ F ТУХ o 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 LinTran() 通 数 进行 线性 变换 


imgInput.LinTran(&imgOutput, fA, fB); 
// 其 中 fA 和 fB 为 线性 变换 的 冬 率 和 截 距 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程 序 运 行 时 会 弹出 对 话 框 ， 要 求 用 户 设 置 
线性 变换 参数 。 话 者 可 以 通过 光 检 中 示例 程序 
DIPDemo 中 的 及早 命令 “点 运 得 线性 变换 ”来 观察 


处 理 效 末 。 


33 KEXI АРН 


Ж К Е J АЕТ” 
换 ， 并 介 绍 它 在 侍 里 叶 频 谱 显示 中 的 应 用 。 


3.3.1 理论 基础 
对 数 变 换 的 一 般 表 达 陈 如 下 。 








t = с log(1+s ) 
(3-3) 


Я, сял, s HKEE, tH 
变换 后 的 目标 灰 度 值 。 


在 如 图 3.8 所 示 的 对 数 曲 线 上 ， 函 数目 变量 为 低 
С RERE EA ИЙЕ 


y=log (х+1.5) 





3.8 ”对 数 变 换 示 意图 


由 对 数 函 数 曲 线 可 知 ， 这 种 变换 可 以 增强 一 幅 
图 像 中 较 暗 部 分 的 细 广 ， 从 而 可 用 来 扩展 锌 压 颖 的 
局 值 图 像 中 的 较 上 蜡像 系 ， 因 此 对 数 变 换 被 广泛 地 应 
用 于 频谱 图 像 的 显示 中 。 一 个 典型 的 应 用 是 健 里 叶 
频谱 (参见 第 6 章 ) ， 其 动态 范围 可 能 宽 达 0 一 10” 
。 直接 显示 频 谐 时， 图像 显示 设备 的 动态 范围 往往 
DREIER, AWARI KERRAT. ME 
ПСР 2 BRIS zu, ES BE Hh dF 2k 


性 压缩 ， 从 而 可 以 清晰 地 显示 。 本 节 的 MATLAB 实 
现 中 就 提供 了 一 个 这 样 的 示例 。 


3.3.2 MATLAB 实 现 


对 数 变 换 不 需要 专门 的 图 像 处 理 疯 数 ， 可 以 使 
用 如 下 数学 函 数 实现 对 图 像 I 的 对 数 变 换 。 





y — 
注意 


log 困 数 会 对 输入 图 像 矩 阵 I 中 的 每 个 元 又 进行 操作 ， 但 是 却 仅 能 处 
理 double 关 型 的 算 阵 。 从 图 像 文件 中 得 到 的 图 像 算 阵 则 大 多 数 是 uint8 
类 型 的 ， 因 此 需要 首先 使 用 im2double 函 数 来 执行 数据 类 型 的 转换 。 


下 面 的 程序 比较 了 对 传 里 时 频 谐 图 像 进行 对 数 


赤 换 前 后 的 效果 〈 不 必 天 注 代 码 中 生成 傅 里 时 频 谐 
的 部 分 ) 。 绪 末 如 图 3.9 所 示 。 





I=imread('coins.png'); % ВЕНА 


fft2(im2double(I)); % 计算 频谱 
fftshift(F); 


F 
F 


F = abs(F); 
T = log(F + 1); % 对 数 变 换 


subplot(1,2,1); 
imshow(F, []); 
title(' 未 经 变换 的 频谱 ' ); 


subplot(1,2,2); 
imshow(T, []); 
title( 对 数 变 换 后 ' ) ; % 显示 原 图 和 变换 结果 





(a) 未 经 变换 的 频谱 (b) 经 过 对 数 变 换 的 频谱 


43.9 ”对 数 变 换 效 果 示 意图 


在 图 3.5 (а) 中 未 经 变换 的 频 详 可见 ， 图 像 中 
心 绝对 噩 灰 度 值 的 存在 压 绚 了 低 灰 度 部 分 的 动态 汇 
拉 ， 从 而 无 法 在 显示 时 表现 出 细节 ; 而 经 过 对 数 灰 
及 处 理 的 图 像 ， 其 低 灰 度 区 域 对 比 度 将 会 增加 ， 瞳 
HBH TAB; 


3.3.3 Visual C++ 实现 


利用 Visual C++ EN ZK E XT AE P ARIS dH 
Te 


| EEEREN EE i В S ЕЕ Ki EEEN ЕСЕ ОЕ ЗЕ КЕЕ ЕЕЕ ЕЛЕ Sas 


BOOL CImgProcess::LogTran(CImgProcess* pTo, double dC) 

功能 : 图 像 的 灰 度 对 数 变 换 

参数 : CImgProcess * pTo: 输出 CImgProcess 对 象 的 指针 
double ас: 灰 度 对 数 变 换 所 需 的 参数 

返回 值 : BO00OL 类 型 ，6 为 成 功 ， 其 他 值 为 失败 


和 


BOOL CImgProcess::LogTran(CImgProcess* pTo, double dC) 


{ 
// ERRE етв Кр RA 
if (m pBMIH->biBitCount!=8) return false; 


BYTE gray; // ТАН, Fi ВЭС жх HJ Zç J Iñi 
int target; // 临时 变量 ,存储 当前 光标 像素 的 目标 值 


for (int i=0; і<т pBMIH->biHeight; i++) 


l 
for (int j=0; j<m_pBMIH->biWidth; j++) 


{ 
gray = GetGray(j, i); 


// 控 公 式 运 算 
target = dC * log( (double)(gray + 1) ); 


if (target < @) target = 0; 
if (target > 255) target = 255; 


// УЛАЖЕ 


pTo->SetPixel(j, i, RGB(target, target, target)); 
J 
J; 


return 0; 


} 





利用 LogTran0 函 数 实现 对 数 变 换 的 完整 示例 被 
封装 在 DIPDemo 工 程 中 的 视图 类 也 数 void 
CDIPDemoView::OnPointLog() 中 ， 其 中 调用 


LogTran) в 89/19 А ri F Рт o 
// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 使 用 对 数 和 变换 方 法 
imgInput.LogTran(&imgOutput, dlg.m dC); 


// 其 中 dlg.m_dC 是 对 数 变 换 的 系数 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 要 求 用 户 设 置 对 
数 变 换 参 数 。 读 者 可 以 通过 光盘 中 示例 程序 
DIPDemo 中 的 荣 单 命令 “点 运算 —, 对 数 变换 ”来 观察 

处 理 效 果 。 


3.4 HJ AEA 


MEERE У 1н ЛЕТА В КАРЧ, єл 1 
单 用 的 灰 度 非 线性 变换 。 


3.4.1 理论 基础 
MERR IRAU F -o 


ек 
(3-4) 


ЖЕН, х Буш HOB WEAN, 1], esp ZJ4ËF 
ZRI ү 则 为 伽 玛 系数 。 


写 对 数 变 换 不 同 ， 伽 玛 变 换 可 以 根据 y 的 不 同 
取 值 选择 性 地 增强 低 灰 有 度 区 域 的 对 比 度 或 是 局 灰 度 
区 域 的 对 比 度 。 


ү ИКЕ ТЕ АЕ НЕ ЗЕ TSA JE 
取 值 决定 了 输入 图 像 和 输出 图 像 之 则 的 灰 度 映 刚 方 
式 ， 即 决定 了 是 增强 低 灰 上 度 〈 表 影 区 域 ) 还 十 增强 
HKE ARKE) 。 


° y> 1 时 ， 图 像 的 高 灰 度 区 域 对 比 度 得 到 增强 。 
。y< 1 时 ， 图 像 的 低 灰 度 区 域 对 比 度 得 到 增强 。 


É wa ш аканнан, иын 


伽 玛 变换 的 映射 关系 如 图 3.10 所 示 。 在 进行 变 
换 时 ， 通 常 需 要 将 0 一 255 的 灰 度 动态 范围 首先 变换 
到 0 一 1 的 动态 范围 ， 执 行 伽 玛 弯 换 后 再 恢复 原 动 态 
范围 。 





图 3.10 0—1š HE EMBERR Ё 


3.4.2 MATLAB 编 程 实现 


MATLAB 中 为 使 用 痢 捉 供 了 实现 灰 度 变换 的 基 
本 工具 imadjust， 它 有 看 非常 广泛 的 用 途 ， 其 调用 
的 一 般 语法 如 下 。 





J = imadjust(I, [low in, high in], [low_out, high out], 


сатта); 





该 函数 将 输入 图 像 I 中 从 low_in 全 high_in 之 间 的 
值 映 里 到 输出 图 像 J 的 low_out 和 high_out 之 间 的 值 ， 
low_in 以 下 和 high_in 以 上 的 值 则 被 入 减 挥 。 


参数 说 明 : 


e。[]ow_in，high_in] 和 [low_onut， high_out] th 定 源 灰 
上 度 范 围 到 目标 灰 度 范围 的 映射 ， 在 给 定 
Пом іп, high iin]#Hl[low_out, high_out] 时 ， 需 要 
按照 double 类 型 给 定 ， 即 取 值 范围 在 0 一 1 之 间 ; 


使 [low_in，high_in] 和 [low_out, high_out] ZJ Z 
low_out， 则 输出 图 像 J] 的 腕 反 将 会 及 转 :; 


。 人参 效 gamma 指 定 了 变换 曲线 的 形状 〈 关 似 于 和 
3.10 中 的 形状 ) ， 其 默认 全 为 1， 夫 示 线 性 映 
Яу. Жгватта<1, ЛЯ ЕЛИ AE E ун НАНТ ЕН 
Е 右 gamma>1， 则 上 映 册 被 加 权 全 更 低 的 输出 





当 gamma 取 1 时 ， 通 过 设 定 合适 的 [low_in，high_in] 和 [low_out， 


high_out] 的 取 值 ，imadjust 函 数 可 以 实现 3.2 贡 中 的 灰 度 线性 变换 :而 当 
[low_in，high_in] 和 [low_out，high_out] 的 取 值 均 为 [0, 1] 时 ， 以 不 同 的 
gamma 调 用 imadjust 函 数 则 可 以 实现 图 3.10 中 所 示 的 各 种 伽 玛 变换 。 


。I 为 输入 图 像 ， 可 以 是 uint8，uint16 或 者 double 类 
FJ 


j eÉ: 
* J 为 经 过 处 理 的 图 像 ， 与 1 具有 同样 的 类 型 。 


将 imadjust 疯 数 用 于 Gamma 屎 换 的 调用 语法 如 
a 


J = imadjust(I,[ ],[ ],gamma) 


К / ратта? 911 8 As EE НАЧИ e gA 
的 程序 实现 。 





I = imread(“pout.tif2); %ËE A J|] 


% Gamma 取 6.75 

subplot(1,3,1); 

imshow(imadjust(I, [ ], [ ], 8.75)); 
title('Gamma 0.75'); 


% Gamma 取 1 
subplot(1,3,2); 
imshow(imadjust(I, [ ], [ ], 1)); 


title('Gamma 1'); 


% Gamma 取 1.5 

subplot(1,3,3); 

imshow(imadjust(I, [ ], [ ], 1.5)); 
title('Gamma 1.5'); 





上 述 程 序 的 运行 结果 如 图 3.11 所 示 ， 可 以 看 出 
不 同 伽 玛 因子 给 图 像 的 整体 明暗 程度 融 来 的 变化 ， 
以 及 对 图 像 蜡 部 和 腕 部 细节 清晰 度 的 影响 。 当 仙 玛 
因子 取 1 的 时 候 ， 图 像 没 有 任何 改变 。 


Gamma 0.75 Gamma 1 Gamma 1.5 





图 3.11 MERKRA 
下 面 的 程序 生成 了 图 3.12 中 3 幅 图 像 的 灰 度 直方 





% Gamma 取 6.75 
subplot(1,3,1); 
imhist(imadjust(I, [ ], [ ], 8.75)); 


title('Gamma 0.75'); 


% Gamma 取 1 

subplot(1,3,2); 
imhist(imadjust(I, [ ], [ ], 1)); 
title('Gamma 1'); 


% Gamma 取 1.5 

subplot(1,3,3); 

imhist(imadjust(I, [ ], [ ], 1.5)); 
title('Gamma 1.5'); 





Gamma 0.75 Gamma 1 Gamma 1.5 
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| 200 
3.12 MHP ZEA J KE EL Л ES] HJ s Hi 


ТЕ 3.12 EL J Ех ur B ЧАРИ, L 
KIX EREA BRER. ЕНТ ae Л 
征 线性 变换 ， 所 以 它 不 仅 可 以 改变 图 像 的 对 比 度 ， 
шаш 从 而 市 来 整体 图 像 效 末 的 增强 和 
ls 


3.4.3 Visual C++ 实现 
利用 Visual C++ 实现 伽 玛 变换 的 代码 如 下 。 





了 下 


BOOL CImgProcess::GammaTran(CImgProcess* pTo, double ga 

mma, double comp) 

功能 : 图 像 的 伽 玛 变换 方法 

参数 : CImgProcess * pTo: 输出 CImgProcess 对 象 的 指针 
double gamma: II 3 žr 


double сотр: 补偿 系数 ,默认 为 6 
返回 值 ， ”B00L 类 型 ，true 为 成 功 ，false 为 失败 


和 


BOOL CImgProcess::GammaTran(CImgProcess* pTo, double ga 
mma, double comp) 


{ 
// HB 48 етв Кр & 
if (m pBMIH->biBitCount!=8) return false; 


BYTE gray; // ТАН, Fi ВЭС жх HJ ZK JS IB 
int target; // 临时 变量 ,存储 当前 光标 像素 的 目标 值 


for (int i=0; і<т pBMIH->biHeight; i++) 


l 
for (int j=0; j<m_pBMIH->biWidth; j++) 


{ 
gray = GetGray(j, i); 
target = pow( (gray+comp)/255.0, gamma ) * 255; 
/ ГАП) А39 


if (target < ©) target = 0; 
if (target > 255) target = 255; 


// 写 入 目标 图 像 
pTo->SetPixel(j, i, RGB(target, target, target)) 


return 0; 


ЖЇН СаттаТгап() A ZKE LA E Н 5с #7 
PRE R (EDIPDemo Т. Ч" НУ 9 2 РА void 


CDIPDemoView::OnPointGamma() 中 ， 其 中 调用 
GammaTran() РА 11У А тп К ТУХ 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 GammaTran 方 法 执行 伽 玛 变 换 
imglnput.GammaTran(&imgOutput, dlg.m dGamma, dlg.m dEsp 


); 
// 其 中 dlg.m_dGamma 和 dlg.m dEsp 为 伽 玛 变换 所 需 的 参数 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 ， 会 弹出 对 话 框 要 求 用 户 设 置 
伽 玛 变换 参数 。 读 者 可 以 通过 光盘 中 示例 程序 
DIPDemo 中 的 荣 单 命令 “点 运算 ”个 玛 变 换 ” 来 观 守 
处 理 效果 。 


35 Ж ИНА 


КРЕ BREZE n] РА@— 2k Bz BA FE Н 
ЕЈ АКИ. HR E Tuy NEH IJ k Ez 
А, ЭПКИН SA = lJ ke TZ Ke dB, UH 
将 该 像素 的 灰 度 值 设置 为 0， 否 则 设置 为 255， 这 个 
起 到 分 蹇 线 作用 的 灰 度 值 称 为 网 值 КЛЕЈ МЕ 
变换 也 和 人 航 称 为 国 值 化 或 二 人 化 。 


3.5.1 理论 基础 
灰 度 国人 变换 的 图 数 表 达 陈 如 下 。 


d x< 
у=}, 255 х>Т 


(3-5) 
其 中 , TITRE H RE - 
3.132 E y KERNER 


г [е 


КЕЗЕ ДОСУНАН НЕОН тш СИСЕЕЕ ЗНН ЕН). 


OO 





3.13 ЖЛЕ ИНА УК R 


ЖУ ИА АР АУА ЕЕЕ 2. 
通过 将 一 幅 灰 度 图 像 转 为 二 值 图 像 ， 可 以 将 图 像 内 
容 赴 搂 划 分 为 读 痢 关心 的 和 不 关心 的 两 个 部 分 ， 从 
而 在 复 森 否 景 中 直接 提取 出 感 兴 趣 的 目标 。 因 此 它 
征 图 像 分 割 的 重要 手段 之 一 ， 这 一 点 在 第 12 章 中 还 


JE RA 
3.5.2 MATLAB 编 程 实现 


MATLAB 中 和 国 值 变换 有 天 的 函数 主要 有 了 两 个 
im2bw 和 graythresh， 下 面 分 别 介 绍 。 


1. 上 国 数 im2bw 可 用 于 实现 国 什 变换， 调用 语 
法 如 下 。 


BW = im2bw(I, level) 


参数 说 明 : 


° 人 参数 [为 需要 二 全 化 的 输入 网 像 ; 

。 人 参数 level 给 出 了 有 具体 的 变换 国 值 ， 它 是 一 个 0 一 
1 之 间 的 双 精 度 浮 点 数 ， 例 如 输入 图 像 I 为 灰 上 度 学 
有 在 0 一 255 之 间 的 uint8 图 像 ， 如 果 ]evel=0.5 则 对 
应 于 分 割 国 什 为 128。 


返回 值 : 
。BW 为 二 值 化 后 的 图 像 。 


2. 水 数 graythresh 可 以 目 适 应 地 确定 变换 所 用 
的 “最 优 ” 浆 值 ， 调 用 形式 如 下 。 





thresh = graythresh(I) 


参数 说 明 : 
。 参数 I 为 需要 计算 浆 值 的 输入 图 像 。 
返回 值 : 


。thresh 是 计算 得 到 的 最 优化 国 仁 。 


灰 虚 国信 level 既 可 以 由 经 验 确 定 ， 也 可 以 使 用 
graythreshO) 国 数 来 目 适 应 地 确定 。 下 面 的 程序 分 别 
展示 了 如 何 利用 graythresh 函 数 狂 得 的 国人 但 和 目 行 设 
E ШИА ИНА. 


= ітгеаа( 'гісе.рпе') % 使 用 Matlab 自 带 的 rice.p 
ng BZ 
>> thresh = graythresh(I) % 自 适 应 确定 浆 值 
thresh = 
0.5137 
>> bw1 = im2bw(I, thresh); % 二 值 化 
>> 


>> bw2 = im2bw(I, 130/255);  % 1305 ИН НИИ, Е 
意 要 将 此 国 值 转换 至 [6，1] 区 间 

>> subplot(1,3,1);imshow(I);title(' 原 图 像 '); 

>> subplot(1,3,2);imshow(bw1);title(' 自 动 选择 阀 值 '); 

>> Subplot(1,3,3);imshow(bw2);title( ' 国 全 136 ' ) ; 





上 述 程序 的 运行 结 来 如 图 3.14 所 示 。 





(a) 原 图 像 (b) АЗИ (с) 阔 值 130 手 工 设置 


43.14 KJE RHB F 328 ЛГ 


H 3.14 (b) ЖШ 3.14 (с) 可 见 ， 单 纯 的 灰 
ВИНА AE FE Jk РЕЖЕ ZJ ҢА 
б, m a A AAAA RA, uki 26 ЛЕГИН Ц 
ТЕБЕ кд» Жи ЖОШ НЕН) Б АШ F Ez Р 
弥补 ， 本 书 将 在 11.4 节 介绍 相关 的 内 容 。 





3.5.3 Visual C++ 实现 


对 于 使 用 Visual C++ 软件 ， 要 实现 国信 化 只 需 
逐 行 扫 摘 图 像 ， 根 据 指 定点 的 像 了 系 信 与 国 值 的 大 小 
天 系 对 其 进行 赋值 即 可 。 其 编码 如 下 。 





J e eo Ека тк a ЕЕ ЕЕЕ ЕЕЕ ЕЕЕ y k pepper 


void CImgProcess::Threshold(CImgProcess *pTo, BYTE nThr 
es) 

功能 : 图 像 的 国信 变换 

参数 : CImgProcess * pTo: 输出 CImgProcess 对 象 的 指针 


BYTE nThres: ДИЕ {Н 

返回 值 : 无 
和 
void CImgProcess: :Threshold(CImgProcess *pTo, BYTE nThr 
es) 
{ 

int i, J; 

BYTE bt; 

for(i = 0; i < m_pBMIH->biHeight; i ++) 


for(j=0; j<m_pBMIH->biWidth; j++) 
l 


// 核心 部 分 算法 ， 小 于 nThres 的 设 为 6， 其 它 设 为 255， 从 
而 得 到 二 全 图 像 
bt = GetGray(j, i); 
if(bt<nThres) 
bt = 0; 
else 
pt = 255; 
pTo->SetPixel(j, i, RGB(bt, bt, bt)); 


利用 Threshold0 函 数 实现 阔 值 化 变换 的 完整 示 
例 逢 封 闻 在 DIPDemo 工 程 中 的 视 网 关 函数 void 
CDIPDemoView::OnPointThre0 中 ， 其 中 调用 


Threshold() р ZT HJARA ИТП F PBH ZS 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// uUijHThresholdJy 17 Q é Ж 
imgInput.Threshold(&imgOutput, bThre); 
// bThre 为 变换 的 国人 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程 友 运 行 时 ， 会 弹出 对 话 杠 要求 用 户 设 置 
国信 参数 。 谍 者 可 以 通过 光一 中 示例 程序 DIPDemo 
中 的 腔 单 命令 “点 运算 ” 国 值 变换 ?来 观 紧 处 理 效 
Ж. 


3.6 ”分 段 线 性 变换 


分 段 线性 变换 有 很 多 和 种， 包括 灰 度 拉 仲 、 灰 度 
HHUH, АИИ ZJ a А НУ 2k E u fi! ç 


3.6.1 理论 基础 


利用 分 段 线 性 变换 函数 来 增强 图 像 对 比 度 的 方 
法 实际 上 是 增强 原 图 各 部 分 的 有 反 牵 ， 即 增强 输入 图 
价 中 感 兴趣 的 灰 度 区 域 ， 相 对 捉 制 那些 不 感 兴 趣 的 
灰 度 区 域 。 分 段 线 性 函数 的 主要 优势 在 于 它 的 形式 
可 任意 合成 ， 而 其 缺 后 十 坝 要 更 多 的 用 尸 输 入 。 


分 段 线性 变换 的 函数 形式 如 下 。 


а «Га 
2559—82 ү. ra) е E 
rT ТЇ) + уд T < Тэ 


ын; Te Ti 
fir) = из. (т— 19) + п Ti < Z< T 





(3-6) 


zÑ (3-6) 中 了 最 重要 的 参数 征 X1，x2] 和 [yi ， 
> ]。 根 据 算法 函数 的 接 述 ， 读 者 可 以 发 现 ， 其 中 x | 
和 x 7 лг mi HE Fe Ph H 2K РЕ Б, H, y1 和 y 7 参数 诀 
ERTER ЈАТ. 


хр, X20 у, уо ЗНАЧАЕН 
时 ， 可 得 到 不 同 的 变换 效果 。 例 如 以 下 情况 。 


° ЖХ 1 =y р, хо=уә, р(х) 271871 
Z, ОЧИ ИЛА RHR E] 

WRX 15X2; у1=0, у> =255, МИ 
КАКЕ, TRIESTE] / BREK 
эш 此 时 的 对 比 度 最 大 ， 但 是 细节 丢失 最 


e хү. Xon Yin уә ЖИВЕЈ ВЕК ЕАР р 
数 的 图 形 如 图 3.15 所 示 。 
分 段 的 灰 度 拉 伸 可 以 更 加 灵活 地 控制 输出 灰 撒 


百 方 图 的 分 布 ， 可 以 有 选 泉 地 拉 伸 东 段 亦 度 区 间 ， 
以 改善 竹 出 图 像 。 如 采 一 幅 图 像 丈 度 集中 在 较 瞳 的 


区 域 而 导致 图 像 偏 暗 ， 可 以 用 灰 度 拉 伸 功 能 来 扩展 
(斜率 >1) 物体 的 灰 度 区 间 以 改善 图 像 ， 同 样 ， 如 
果 图 像 灰 度 集中 在 较 亮 的 区 域 而 导致 图 像 偏 亮 ， 也 
可 以 用 灰 度 拉 伸 功能 来 压缩 斜率 <1) 物体 灰 度 区 
间 以 改善 图 像 质量 ， 


灰 度 分 段 线 性 变换 
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图 3.15” 灰 度 的 分 段 线性 变换 


灰 度 拉 伸 是 通过 控制 输出 图 像 中 灰 度 级 的 展开 
枉 度 来 达到 控制 对 比 度 的 效 未 的。 一 般 情 况 下 都 限 
制 x1<x2，y1<y2， 从 而 你 证 函数 是 单调 违 增 的 ， 
DA HEE Da k PRAD EES HI BMR P ZAKE R A E REI o 


3.6.2 MATLAB 编 程 实现 


2848 5) J іпегауѕсаіпо() AAR EIKE k 
EEH, EMTS tA“ chapter3/code” 4 F HJ 
imgrayscaling.m XF F , 


ТЕЖ ТАУН Н Pla p PJMATLABEI Ah р 2, 
imgrayscaling0 H AIRAA, CP MERE, KE RIEA 
EH, Pl double. uint8 A (10 77 КАЈ. h F e lli e, 
本 书后 面 的 所 有 的 MATLAB 函 数 都 只 将 注意 力 集 中 在 算法 本 身 ， 不 再 
考虑 对 各 种 类 型 图 像 的 兼容 性 问题 。 如 果 读 者 需 要 处 理 多 种 类 型 的 图 
像 ， 可 以 参考 imgrayscaling0) 函 数 的 编写 方法 和 技巧 。 


1. 输入 的 处 理 


为 了 可 以 使 用 可 变 个 数 的 参数 ， 
imgrayscaling() 函 数 中 使 用 了 细胞 数组 (参见 1.1.6 
小 广 ) ， 将 函数 的 输入 参数 整体 看 作 一 个 细胞 数 
组 。 为 此 需要 编写 一 个 parse_inputs() 函 数 来 解 术 访 
细胞 数组 的 内 容 ， 访 函数 的 返回 信 为 
中 所 有 可 能 由 用 户 礼 始 化 的 参数 


parse_inputsO) 函 数 的 完整 实现 如 下 ， 其 中 对 未 
知 个 数 的 输入 使 用 了 参数 varargin 来 表示 。 


function [А, тар, х1, х2, yl, y2] = parse inputs(vararg 


= 
М 


这 束 是 用 来 分 析 输 入 参数 个 数 和 有 效 性 的 函数 parse inputs 
A mAB, RGA) (3D), KÆRI (2D)， 或 者 索引 图 (X 


map 索引 图 调 色 板 (:,3) 

[х1,х2] 参数 组 1， 曲 线 中 两 个 转折 点 的 模 坐 标 

[у1,у2] 参数 组 2， 曲 线 中 两 个 转 打 点 的 纵 坐 标 

自 先 建立 一 个 空 的 map 变 量 ， 以 免 后 面 调用 isempty(map) 时 出 错 
map = []; 


N N XN 55 — 55 55 н. 


% ккан N 检查 输 
入 参数 的 个 数 是 

% 符合 要 求 ， 即 NUM INPUTS 中 包含 的 输入 变量 个 数 是 否 在 LOW 和 HI 
GH 所 指定 的 范围 

% ”内 。 如 果 不 在 范围 内 ， 则 此 函数 给 出 一 个 格式 化 的 错误 信息 。 


iptchecknargin(3,4,nargin,mfilename); 


% IPTCHECKINPUT(A,CLASSES,ATTRIBUTES,FUNC NAME,VAR NA 

ME, ARG POS) 检查 给 定 

% ”矩阵 A 中 的 元 素 是 天 属于 给 定 的 类 型 列表 。 如 果 存 在 元 素 不 属 二 

给 定 的 类 型 ， 则 给 出 

% ”一 个 格式 化 的 错误 信息 。 

iptcheckinput(varargin{1},... 
{'uint8','uint16','int16','double'}, 
{'real', 'nonsparse'},mfilename,'I, X ог R 

GB',1); 


% RERNA E, A E eE 
switch nargin 

case 3 % 可 能 是 imgrayscaling(I，[x1,x2]，[y1l， 
y2]) 或 imgrayscaling(RGB, [x1,x2], [y1,y2]) 

A = varargin{1}; 

x1 = varargin{2}(1); 

x2 = varargin{2}(2); 

у1 = varargin{3}(1); 

y2 = varargin{3}(2); 


case 4 

A = varargin{1};% imgrayscaling(X, map, 
[x1,x2], [y1,y2]) 

map = varargin{2}; 

x1 = vararginí2)(1); 

x2 = vararginí2)(2); 

у1 = vararginí3)(1); 

y2 = vararginí3)(2); 
end 


% 检测 输入 参数 的 有 效 性 
% 检查 RGB 数组 
if (ndims(A)= =3) && (size(A,3) 一 =3) 
msg = sprintf('%s: 真 彩色 图 像 应 当 使 用 一 个 M-N-3 维 度 的 数 
A 
upper (mfilenanme) ) ; 
eid = sprintf('Images:%s:trueColorRgbImageMustBeMby 
Nby3',mfilename); 
error(eid, '%s',msg); 
end 


if ~isempty (map) 
% 检查 调 色 板 
if (size(map,2) —= 3) || ndims(map)>2 
msg1 = sprintf('%s: 输入 的 调 色 板 应 当 古 一 个 矩阵 '"， 
upper (mfilenanme) ) ; 

msg2 = ' 并 拥有 三 列 '; 

eid = sprintf('Images:%s:inColormapMustBe2Dwith3Col 
s',mfilename); 

error(eid,'%s %s',msgl,msg2); 


elseif (min(map(:))<0) || (max(map(:))>1) 
msg1 = sprintf('%s: 调 色 板 中 各 个 分 量 的 强度 ',upper(mf 
ilename)); 
msg2 = “应 当 在 8 和 1 之 间 '; 


eid = sprintf('Images:Z%s:colormapValsMustBe@tol',mf 
ilename); 
error(eid,'%s %s',msg1,msg2); 
end 
end 


% 将 int16 类 型 的 滤 阵 转换 成 uint16 类 型 
if isa(A,'int16') 

A = int16touint16(A); 
end 





2. 输出 的 处 理 


可 以 耳 接 人 退 过 nargout 这 个 参数 判断 用 于 接收 结 
果 的 参数 个 数 。 参 数 nargout 是 由 MATLAB 自 动 赋值 
的 ， 如 末 调 用 imgrayscalingO0 时 疫 有 使 用 变量 接收 
返回 什 ， 则 函数 下 接 将 结果 通过 imshow 命 令 显 示 出 
Ж. 


% 输出 
if nargout= =0 % 显示 结果 
imshow(out); 


return; 
end 





З. РАНУ) 


imgrayscaling() р) Д F o 


function out = imgrayscaling(varargin) 


IMGRAYSCALING 执行 灰 度 拉 伸 功能 
|; 
out = imgrayscaling(I, [x1,x2], [у1,у2]); 


out = imgrayscaling(X, map, [x1,x2], [у1,у2]); 
out = imgrayscaling(RGB, [x1,x2], [у1,у2]); 
РСЕ t ku he, 0 А ЕЙ зА ЖЕКЕЙ, (Hu 
TERP АУЛ ЛАХУ 

% ЁН, KAS НӘ ЕКТЫЛАР х1, x2, yl, y2 
应 当 使 用 双 精 度 

% ”类 型 存储 ， 图 像 窍 阵 可 以 使 用 任何 MATLAB 文 持 的 类 型 存储 。 


SS N XN XN XN X 


[A, map, x1 , x2, y1, y2] = parse_inputs(varargin{:}); 


% 计算 输入 图 像 A 中 数据 闫 型 对 应 的 取信 范围 
range = getrangefromclass(A); 
range = range(2); 


% 如 有 果 和 输入 图 像 不 是 灰 度 图 ， 则 需要 执行 转换 

if ndims(A)= =3,% АЖ 732, АСВ 
A = rgb2gray(A); 

elseif —isempty(map),% MAP 变 量 为 非 空 ， 索 引 图像 
А = ind2gray(A,map ) ; 

епа % 对 灰 度 图 像 则 不 需要 转换 


% 读 取 原始 图 像 的 大 小 并 初始 化 输出 图 像 
[M,N] = size(A); 
I = im2double(A); % 将 输入 图 像 转换 为 双 精 度 类 型 


out = zeros(M,N); 


% ЕИО, АКА PE АЕ ЙУ 
for i=1:M 
for j=1:N 
if 1(1,])<х1 
out(i,j) = y1 * I(i,j) / х1; 


elseif I(i,j)>x2 
out(i,j) = (I(i,j)-x2)*(range-y2)/(range-x2) 
+ y2; 
else 
out(i,j) = (I(i,j)-x1)*(y2-y1)/(x2-x1) + y1; 
end 
end 
end 


% 将 输出 图 像 的 格式 转化 为 与 输入 图 像 相同 
if іѕа(А, 'uint8') % uint8 
out = im2uint8(out); 
elseif isa(A, 'uint16') 
out = im2uintl6(out); 
% 其 他 情况 ， 输 出 双 精 度 类 型 的 网 像 
end 
% 输出 : 
if nargout= =0 % 如 果 没 有 提供 参数 接受 返回 值 
imshow(out); 


return; 
end 


125 519 Himgrayscaling() A 22 SEM JK JE k 
性 变换 的 调用 示例 ， 程 序 实 现 中 分 别 使 用 了 两 组 不 
同 的 变换 参数 。 代 人 码 如 下 。 





>> I = imread('coins.png'); % 读 入 原 图 像 

>> J1 = imgrayscaling(I, [0.3 0.7], [0.15 0.85]); 
>> figure，imshow(J1，[]);% 得 到 图 3.16 左 图 

>> J2 = imgrayscaling(I, [0.15 0.85], [9.3 0.7]); 
>> figure, imshow(J2, []); % 得 到 图 3.16 右 图 


| 
上 述 程序 的 运行 结果 如 图 3.16 和 图 3.17 所 示 。 


[xi x2]=[0.3 0.7].[w y;]=[0.15 0.85] [xi x2]=[0.15 0.85].[y, y;]=[0.3 0.7] 





图 3.16 ”对 图 3.7 (а) 鸭 分 段 灰 度 变 换 的 效 来 


[х\ x;]=[0.3 0.7].[y, уъ]=[0.15 0.85] [х 21500.15 0.85].[y, уъ]=[0.3 0.7] 





3.17 rE JK EE A XJ EL ЧИЈИ 


从 图 3.16 和 图 3.17 可 以 看 到 第 一 组 参数 让 图 像 
灰 度 直方 图 上 的 非 零 区 域 扩展 ， 而 第 二 组 参数 让 图 
WJ KJ Н. Л) EZ ХБ Ka, 225 Н 1 8 TH Ж 
了 稚 然 不 同 的 效果 。 第 一 幅 图 像 中 的 细节 更 加 清 
Mr, Т ЛЕНӘ зи Е. 


3.6.3 Visual C++ 编程 实现 


利用 Visual C++ 实现 图 像 的 灰 度 分 段 线性 变换 
的 代码 如 下 。 





了 


BOOL CImgProcess::ParLinTran(CImg * pTo, BYTE х1, BYTE 
x2, BYTE yl, BYTE y2) 
功能 图 像 的 灰 Уу 分 段 线性 变换 


限制 | ; x1 < x2 
参数 : CImg * pTo: 输出 CImg 对 象 的 指针 

BYTE х1: 分 段 线性 变换 第 一 点 的 横 坐 标 

BYTE х2: 分 段 线性 变换 第 二 点 的 横 坐 标 

BYTE y1: 分 段 线性 变换 第 一 点 的 纵 坐 标 

BYTE у: 分 段 线性 变换 第 二 点 的 纵 坐 标 
返回 值 : ”BOO0L 类 型 ，TRUE 为 成 功 ，FALSE 为 失败 
人 
BOOL CImgProcess::ParLinTran(CImg * pTo, BYTE x1, BYTE 
x2, BYTE yl, BYTE y2) 


{ 

// 首先 检查 疼 像 的 类 型 

if(m pBMIH->biBitCount != 8) return FALSE; // 不 是 8-b 
pp 灰 度 图 像 ， iR |H| tR TA 


// ЛАО ГЫ 
if (x1>x2) return FALSE; // 参数 关系 错误 ,返回 错误 


ВҮТЕ gray; // 临时 变量 ,存储 当前 光标 保 系 的 灰 度 值 
int target; // 临时 变量 ,存储 当前 光标 像素 的 目标 值 


for (int i=0; і<т pBMIH->biHeight; i++) 


ү for (int j=0; ј<т pBMIH->biWidth; j++) 
i gray = GetGray(j, i); 
// 控 公 式 运 算 
if (gray<=x1) 
| target = у1 * gray / х1; 
ы if (gray<=x2) 
l 


target = (y2-yl)*(gray-x1)/(x2-x1) + у1; 
J 


else 


target = (255-y2)*(gray-x2)/(255-x2) + y2; 


if (target < ©) target = ө; 


if (target > 255) target = 255; 


// 写 入 目标 图 像 
pTo->SetPixel(j, i, RGB(target, target, target)); 


} 
} 


return TRUE ; 
J 


ДН ParLinTran( RAEM 5:26 ТЕЛЕЕ IJ 5С 
整 示 例 被 封装 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView::OnPointStdlin() 中 ， 其 中 调用 
ParLinTran0 国 数 的 代码 请 断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 分 段 线 性 变换 
imgInput.ParLinTran(&imgOutput, dlg.m bS1, dlg.m bS2, d 


lg.m bT1, dlg.m bT2); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设置 
杰 换 参数 。 旋 者 可 以 通过 光盘 中 示例 程序 DIPDemo 
中 的 菜单 命令 “ 氮 运算 ”分 段 线性 变 所 ? 来 观察 处 理 
A. 


3.7 Еле 


ЖУТ ЭЗЕН {ЕК ҤЕ 77 S] EPS A 
一 一 生 方 图 均衡 化 。 


3.7.1 理论 基础 


百 方 匈 均衡 化 又 称 为 艾 度 均衡 化 ， 征 指 通过 未 
PP ZK БЕШИ Л. КЕЖЕ ЖИЛЕ — AKER ГАН 
ЛАИН H АЧИ Ж кл СН а) rh КЖ СЕПИЛГЕ ЛТ B 
EJAJ o АЫК ПУ, BR 
将 占有 尽 可 能 多 的 灰 度 级 并 且 分 布 均匀 。 因 此 ， 这 
样 的 图 像 将 共有 较 遍 的 对 比 度 和 较 关 的 动态 范围 。 


为 了 便于 分 析 ， 让 旋 者 首先 考虑 灰 度 范围 为 0 
一 1 且 连 续 的 情况 。 此 时 图 像 的 归 一 化 直方 图 即 为 
概 圣 密度 函数 (PDF) 。 


р(т),0< z < 1 


(3-7) 


HAM ЛУ RAEM, ВАРКА. 


l 


J р(т)ат = 1 


(3-8) 


WER PR AI EHA ИЖ 2 E 8 ри Ж Jp (r )， 转 换 
Да | Ж ЛЕ рК Уур (5), RRRA СОЮЛУ 
映射 关系 ) 为 s= f(r )。 由 概率 论 知 识 可 得 下 式 。 


>, dr 
p(s) = рғ) ` — 


ds 
(3-9) 


FF, HHK AH EG i КИЙ HJ 22 Ж JS рА 
Ж: р.(5)=1, 0<S<1 (〈 即 直方 图 为 均匀 的 ) ， 则 
必须 满足 下 陈 。 


(3-10) 


(3-11) 


= (3-11) КИНУ RIRI TE РА 
(CDF) 。 


= (3-11) 是 在 灰 度 取信 在 [0, 11% H рУ АЧТА їл, 
下 推导 出 来 的 ， 对 于 [0, 25510186, H E ДХ 
ЖР О mx 〈 对 于 灰 度 网 加 是 255) Вп. НК 
皮 均 衡 的 转换 公式 如 下 。 


Dp = fi Da) == Еак / Рр. (mdu 
0 


(3-12) 


KP, Ов 9%) WJ2K 28, Da 为 转换 前 的 
JK J (н. 


而 对 于 离散 灰 度 级 ， 相 应 的 转换 公式 应 如 下 。 
Dg = fl Da) = З > Н; 
(3-13) 


APH; 为 第 i 级 灰 度 的 像 系 个 数 ，A 0 为 图 像 的 
面积 ， 即 像 系 已 数 。 


z (3-13) 中 的 变换 函数 F 是 一 个 单调 增加 的 
图 数 ， 这 保证 了 在 输出 图 像 中 不 会 出 现 灰 度 反 转 的 
情况 〈 变 换 后 相对 灰 度 不 变 ) ， 从 而 能 够 防止 在 变 
换 中 改变 网 像 的 实质 ， 以 至 于 影响 对 图 像 的 识别 和 
判读 。 

这 里 还 需要 说 明 一 点 ， 对 于 式 (3-13) 的 离散 
蛮 换 ， 通 党 无 法 再 像 连 续 变 换 时 那样 可 以 得 到 严格 
的 均匀 概率 密度 函数 (p ,(S )=1, 0<5 <1) 。 但 无 
论 如 何 ， 式 “3-13) 的 应 用 有 展开 输入 图 像 直 方 图 
的 一 般 趋 势 ， 可 使 得 均衡 化 过 的 图 像 灰 度 级 具有 更 
大 的 范围 ， 从 而 得 到 近似 均匀 的 直方 图 。 

3.7.2 MATLAB 编 程 实现 


MATLAB 疼 像 处 理工 具 箱 提 供 了 用 于 直方 图 均 
衡 化 的 函数 histeq()， 调 用 语法 如 下 。 


[J, T] = histeq(I) 


参数 说 明 : 
° 十 原始 图 像 。 
返回 值 : 


° 是 经 过 直方 图 均衡 化 的 输出 图 像 ; 
° ТАЕ. 
ПЕТР 


图 像 易 受 光照 、 视 角 、 方 位 、 噪 声 等 的 影响 。 
在 这 些 因 系 的 作用 下 ， 同 一 类 图 像 的 不 同 变 形体 之 
司 的 牵 距 有 时 大 于 设 类 图 像 与 为 一 类 图 像 之 则 的 下 
忠 ， 这 束 给 图 像 识 列 / 分 类 市 来 了 了 困扰。 图 像 归 一 
化 束 古 将 图 像 转 换 成 唯一 的 标准 形式 以 抵抗 各 种 变 
Їй, 从 而 可 消除 同类 图 像 不 同 变 形体 之 间 的 外 观 天 
+ о 


当 图 像 归 一 化 用 于 消除 灰 度 因 系 光照 圭 ) E 
成 的 图 像 外 观 变化 时 ， 称 为 图像 〉 灰 上 度 归 一 化 
。 例 3.1 为 读者 展示 了 如 何 利 用 和 耳 方 图 均衡 化 来 实现 
图 像 的 灰 度 归 一 化 。 


【 例 3.1】 利用 直方 图 均衡 化 技术 实现 图 像 的 
KEH. 


下 面 的 程序 在 谈 入 了 图 像 pouttif 后 ， 分 别 对 其 
进行 了 增加 对 比 上 度 、 减 小 对 比 度 、 线 性 增加 亮度 和 
线性 减 小 亮度 的 处 理 ， 得 到 了 原 图 像 的 4 个 灰 度 变 
化 版 本 ; 接着 义 分 别 对 这 4 幅 图 像 进行 了 直方 图 均 
衡 化 处 理 并 显示 了 它们 在 处 理 前 、 后 的 直方 图 。 





I = imread('pout.tif'); % 读 入 原 图 像 
I = im2double(I); 


% 对 于 对 比 度 变 大 的 图 像 
I1 = 2 * I = 557255; 
subplot(4,4,1); 
imshow(11); 
subplot(4,4,2); 
imhist(I1); 
subplot(4,4,3); 
imshow(histeq(I1)); 
subplot(4,4,4); 
imhist(histeq(I1)); 


% 对 于 对 比 度 变 小 的 图 像 
I2 =:0.5: 7 I + 55/255: 
ѕирр101 (4,4,5); 
imshow(I2); 
subplot(4,4,6); 
imhist(I2); 
subplot(4,4,7); 
imshow(histeq(I2)); 
subplot(4,4,8); 
imhist(histeq(I2)); 


% ATTAT ЛП БЕ ЈИ 
ІЗ = І + 55/255; 
ѕирр101 (4,4,9); 
imshow(I3 ) ; 
subplot(4,4,10); 
imhist(I3); 
subplot(4,4,11); 
imshow(histeq(I3)); 
subplot(4,4,12); 
imhist(histeq(I3)); 


% 对 于 线性 减 小 腕 度 的 图 像 
I4 = I - 55/255; 


subplot(4,4,13); 
imshow(14); 
subplot(4,4,14); 
imhist(I4); 
subplot(4,4,15); 
imshow(histeq(I4) ) ; 
subplot(4,4,16); 
imhist(histeq(I4)); 





上 述 程序 的 运行 的 结 末 如 图 3.18 所 示 。 


从 图 3.18 中 可 以 友 现 ， 将 卫 方 图 均衡 化 算法 应 
用 于 堪 侧 的 完 度 、 对 比 度 不 同 的 各 个 图 像 后 ， 得 到 
ТАЛЕ Jy | ХЕ®ХЛН HEZ, Ж Y El J >) 
衡 化 作为 强大 自 适 应 性 的 增强 工具 的 作用 。 当 原始 
图 像 的 直方 图 不 同 而 图 像 结 构 性 内 容 相 同时 ， 直 方 
图 均衡 化 所 得 到 的 结 来 在 视 先 上 几乎 是 完全 一 公 
有 的。 这 对 于 在 进行 图 像 分 析 和 比较 之 击 将 图 像 半 化 
ма-а T AF41 йй [ЇЇ] е 
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0 05 | 
(a) 对比度 较 高 图 像 E) 的 直方 图 均衡 化 效果 【 右 ) 
2000 | s 
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(b) 对 比 度 较 低 图 像 (Ze) 的 直方 图 均衡 化 效果 《【 右 ) 










0 05 1 0 05 1 
(c) 亮度 较 高 图 像 【 左 ) 的 直方 图 均衡 化 效果 (种) 





0 05 | БО 0 05 1 
(d) 亮度 较 低 图 像 左 ) 的 直方 图 均衡 化 效果 【( 右 ) 


3.18 不 同 完 度 、 对 比 度 图 像 的 直方 图 均衡 化 效 末 


本 书后 面 将 要 介绍 的 很 多 图 像 处 理 方法 都 是 以 归 一 
化 为 目的 的 ， 比 如 第 4 章 几 何 变 换 束 是 研究 一 种 几 
何 失 真 的 归 一 化 处 理 。 


3.7.3 Visual C++ 实 现 


利用 Visual C++ 实 现 图 像 的 灰 度 直方 图 均衡 化 
的 代码 如 下 。 


站 
BOOL CImgProcess::Histeq(CImgProcess * pTo) 
功能 : 图 像 的 灰 度 直方 图 均衡 化 方法 
参数 : CImgProcess * pTo 
输出 CImgProcess 对 象 的 指针 
BEE: ”BOO0L 类 型 ，true 为 成 功 ，false 为 失败 
T Y POK АЕА EY ЕЕЕ 


BOOL CImgProcess::Histeq(CImgProcess * pTo) 
{ 

// АУ з RN E8 MAE BRR 

if (m pBMIH->biBitCount!=8) return false; 


BYTE gray; // 临时 变量 ,存储 当前 光标 像素 的 灰 度 值 
int target; // 临时 变量 ,存储 当前 光标 像素 的 目标 值 


double pdHist[256]; //MH EE, TEKEAR 
double dTemp; // ПНА, rd AN 23 
this->GenHist(pdHist); 


for (int i=0; i<m pBMIH->biHeight; i++) 
l 


for (int j=0; ј<т pBMIH->biWidth; j++) 
{ 

dTemp = ө; 

gray = GetGray(j, i); 

for (BYTE k=0; k<gray; k++) 


dTemp+=*(pdHist + k); 
J; 
target = 255 * dTemp; 


if (target < ©) target = ө; 
if (target > 255) target = 255; 


// 写 入 目标 图 像 
pTo->SetPixel(j, i, RGB(target, target, target)) 


} 
}; 


return true; 


АІ Ніѕгед() K ZK I EL J ЧИИ Ч TEER 
例 被 封装 在 DIPDemo 工 程 中 的 视图 类 函数 
CDIPDemoView::OnPointEqua()， 其 中 调用 Histeq0 
РЁ ЖИ НУ ТМ ЮТАП ТЛ: 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 直方 图 均衡 化 
imgInput.Histeq(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “点 运算 ,直方 图 均衡 化 ”来 观察 处 理 效 果 。 
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ЕУР А эЛ ХЕ РАР РА 
Ж, ЛН 272) 67 Н 1. EH 
НР RSA йи. н УНУ ЕЕ ОЧ ШЕЛЕР, Е BAN 
KERo ОО АНУ Е ЕГЕТЕ А, Ва 
ДАП, т Н H Н е ДУ ЈЕ. 


但 读者 有 时 布 户 可 以 对 变换 过 程 加 以 控制 ， 如 
能 够 人 为 地 修正 耳 方 图 的 形状 ， 或 者 说 十 获得 上 其 有 
日 定 直方 图 的 输出 图 像 ， 这 样 融 可 以 有 选择 地 增强 
ЛУКЕ ўш Е РУ НЧ БИЕ AE РАИ ЕА IP ХЕ я 
特定 的 分 布 。 这 种 用 于 产生 具有 特定 直方 图 的 图 像 
的 方法 叫 作 和 卫 方 图 规定 化 Pk EL УИС. 


3.81 理论 基础 


耳 方 图 规定 化 是 在 运用 均衡 化 原理 的 基础 上 ， 
通过 建 工 原始 图 像 和 期 纤 图 像 〈 待 匹配 直方 多 的 图 
Ж) 之 间 的 关系 ， 便 原始 图 像 的 百 方 图 匹配 特定 的 
形状 ， 从 而 弥补 了 直方 图 均衡 化 不 具备 交互 作用 的 


特性 。 


其 匹配 原理 是 先 对 原始 的 图 像 均衡 化 ， 转 换 公 
т К. 


s= t) = | ыдар 
(3-14) 
同时 对 待 匹 配 直方 图 的 图 像 进行 均衡 化 处 理 ， 
公式 如 下 。 
v = 008) = J | р. (NdAV 
(3-15) 
由 于 都 是 均衡 化 ， 故 可 令 s=v ， 则 有 如 下 关 


УКА Бо, 


U 一 g` [5] == gq 1( f(r) | 


(3-16) 


于 是 可 以 按照 如 下 的 步 又 由 输入 图 像 得 到 一 个 
RHA REME A RE KAHI ENS 


(1) 根据 式 (3-14) 得 到 变换 关系 Fr )。 
(2) 根据 式 (3-15) 得 到 变换 关系 g (2). 
(3) 求 得 反 变 换 函 数 g -1 (s). 


(4) 对 得 入 图 像 所 有 像 系 应 用 陈 〈3-16) 中 
的 变换 ， 从 而 得 到 输出 图 像 。 


当然 ， 在 实际 计算 中 利用 的 是 上 述 公 式 的 离散 
形式 ， 这 样 就 不 必 去 关心 函数 f(r )、g (z ) 以 及 反 变 
换 函 数 g -1 (s) 具 体 的 解析 形式 ， 而 可 以 直接 将 它们 
作为 映射 表 处 理 了 。 其 中 ，f(r ) 为 输入 图 像 均衡 化 
的 离散 灰 度 级 映射 关系 ，g (z ) 为 标准 图 像 均衡 化 的 
离散 灰 度 级 映射 关系 ， 而 g -1 (s) 则 是 标准 图 像 均衡 
化 的 逆 映 射 关 系 ， 它 给 出 了 从 经 过 均衡 化 处 理 的 标 
准 化 图 像 到 原 标准 图 像 的 离散 灰 度 映射 ， 相 当 于 均 
衡 化 处 理 的 道 过 程 。 


3.8.2 MATLAB 编 程 实现 


Histeq() 芳 数 不 仅 可 以 用 于 生 方 图 均衡 化 ， 也 
可 以 用 于 和 直方 图 规定 化 ， 此 时 需要 提供 可 选 参数 


hgram。 调 用 语法 如 下 。 


[J, T] = histeq(I, hgram) 


困 数 会 将 原始 几 像 上 处 理 成 一 幅 以 用 户 指定 癌 
量 hgram 作 为 直方 图 的 图 像 。 


参数 hgram 的 分 量 数目 即 为 直方 图 的 收集 箱 数 
目 。 对 于 double 型 图 像 ，hgram 的 元 素 取 值 范围 是 
[0, 1]; 对 于 uint8 型 图 像 取 值 范 围 为 [0, 255]; 对 于 
uint16 型 图 像 取 值 范围 则 为 [0, 65535]. 
其 他 参数 的 意义 与 在 直方 图 均衡 化 中 的 相同 。 
【 例 3.2】 和 直方 图 的 匹配 。 


下 面 的 程序 实现 了 从 图 像 1 分 别 到 图 像 T1 和 I2 
HJ EL J ЧАС. 





I = imread('pout.tif'); % 读 入 原 图 像 


11 = imread('coins.png'); XZA ENE AD BH BS 
I2 = imread('circuit.tif'); XZA ZULM EL J ҤЕ @ 


% 计算 直方 图 
[hgram1, x] 
[hgram2, x] 


imhist(I1); 
imhist(I2); 


% 执行 且 方 图 均衡 化 


J1=histeq(I,hgraml); 
J2=histeq(I,hgram2); 


% 绘图 

subplot(2,3,1); 
imshow(I);title(' 原 图 '); 
subplot(2,3,2); 

imshow(I1); title(' 标 准 图 1' ) ; 
subplot(2,3,3); 

imshow( I2); title(' 标 准 图 2' ); 
subplot(2,3,5); 

imshow(J1); title(' 规 定 化 到 1') 
subplot(2,3,6); 
imshow(J2);title(' 规 定 化 到 2"'); 


% 绘 直 方 图 


figure; 


subplot(2,3,1); 
imhist(I);title(' 原 图 '); 


subplot(2,3,2); 
imhist(I1); title(' 标 准 图 1' ); 


subplot(2,3,3); 
imhist(I2); title(' 标 准 图 2' ) ; 


subplot(2,3,5); 
imhist(J1); title(' 规 定 化 到 1') 


subplot(2,3,6); 
imhist(J2);title(' 规 定 化 到 2' ) ; 


上 述 程 友 的 运行 结果 如 图 3.19 和 图 3.20 所 示 。 


读 痢 可 以 看 到 ， 经 过 规定 化 处 理 ， 原 图 像 的 卫 方 图 
写 目 标 图 像 的 直方 图 变 得 较为 相似 。 
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63.20 下方 匈 规定 化 后 的 灰 度 百 方 图 


АЕА Бле Й РЕ, [ААР 
З НУ El ЧЕ H PRSI Е 77 ЁЛУ 
全 一 致 。 然 而 即使 只 征 相 似 的 拟 合 ， 仍 然 使 规定 化 
的 图 像 在 有 完 度 与 对 比 度 上 有 具有 类 似 标 准 图 像 的 特 
人 性， 这 正 征 直方 多 规定 化 的 目的 所 在 。 


3.8.3 Visual C++ 实现 


根据 前 文 提 到 的 变换 方法 ， 可 以 首先 计算 原 图 
像 直方 图 均衡 化 的 离散 变换 关系 sk =f (т) Ох 
里 ry =0, 1, 2, ..., 255) ， 而 后 计算 标准 图 像 直 方 图 
均衡 化 的 离散 变换 关系 ww д (zr) (这 里 zx =0, 1, 
2, ..., 255) ， 从 而 进一步 得 到 道 映射 关系 g -1 (sx ) 
或 g 1 (vk )， 再 利用 关系 yk =sk ， 可 得 zx =g (vk )= 9 
(sx )， 即 对 原 图 像 的 均衡 化 结果 sy 执行 标准 图 像 
均衡 化 的 反 变 换 g -1 (sy ) 或 g `! (ук) 。 


下 和 面 HiststO 的 实现 中 首先 记录 下 标准 图 像 或 其 
直方 图 进行 直方 图 均衡 化 时 每 一 灰 度 级 别 在 均衡 化 
后 对 应 的 灰 度 级 ， 为 了 得 到 逆 变 换 关 系 g -+ ， 通 过 
pdTran 数 组 直接 建立 从 均衡 化 后 的 灰 上 度 级 w 到 均衡 
化 之 前 标准 图 像 灰 度 级 到 НОТ НУ. 


*(pdTran + (int)(255 * dTemp)) = i; 


将 均衡 化 后 的 原 图 像 中 每 一 灰 度 级 按照 这 种 首 
决 射 关系 进行 变换 ， 即 可 得 到 直方 图 规定 化 后 的 结 
ж О 
注意 

由 于 均衡 化 变换 关系 v | =g (z, ) 无 法 保证 变换 后 的 灰 度 vk 取 到 0 


—255 EJ RUR, ЊТ: Уа 1 (у) 160-2556: у 
上 没有 定义 。 如 2=g (0)，5=g (TD， 则 逆 映 射 表 中 g 1 (3) 和 g -1 (4) 均 无 有 
意义 的 值 ， 此 时 可 令 它 们 取 逆 映射 表 中 最 近 的 上 一 次 的 有 意义 的 逆 陨 

SHE, 809 (3)= 9! (4)= а! (2)=0; 当然 也 可 以 取 逆 映射 表 中 最 近 的 下 
一 次 的 有 意义 的 逆 映 射 值 ， 即 g 工 (5)=1， 两 种 方式 的 误差 肯定 都 在 1 之 
内 ， 程 序 实现 中 本 文采 用 了 第 1 种 方式 。 


直方 图 规定 化 方法 Histst( ) 的 完整 实现 如 下 。 


ВИИ РОР ЕО РИИ ОЕР АВО ss 


BOOL СІтеРгосеѕ5: :Ніѕ151(СІтеРгосеѕ5* рТо, double* pdSt 


dHist) 

功能 : ИЖЕ А ЧЕЛИ 

参数 : CImgProcess * pTo: 输出 CImgProcess 对 象 的 指针 
double * pdStdHist: 标准 直方 图 数组 (要 求 已 经 归 一 

化 的 直方 图 ) 


返回 值 : ”BOO0L 类 型 ，true 为 成 功 ，false 为 失败 


о за ааа 
BOOL СІтеРгосеѕ5: :Ніѕ151(СІтеРгосеѕ5* рТо, double* pdSt 
dHist) 

l 


int i,J; 


// HB 48 етв MAE | A 
if (m pBMIH->biBitCount!=8) return false; 


BYTE gray; // 临时 变量 ,存储 当前 光标 像素 的 灰 度 值 
int target; // 临时 变量 ,存储 当前 光标 像素 的 目标 值 


double pdHist[256]; // 临时 变量 ,存储 灰 度 直方 网 
this->GenHist(pdHist); 


double dTemp; // 临时 变量 ,存储 累加 的 直方 图 数据 
int pdTran[256]; // 临时 变量 ,存储 标准 直方 图 均衡 化 的 变 


Pe kE RE 
memset(pdTran, -1, sizeof(int)*256); 


// 求 标 准 和 直方 图 的 均衡 化 变换 和 滤 阵 
for (1=0; 1<256; i++) 
{ 

dTemp = ө; 

for (BYTE k=0; К<1; k++) 


аТетр+=* (раѕ+аніѕ + к); 


*(pdTran + (іп) (6Ө.5+255 * dTemp)) = i; 
J 


// KEREJETA ERE BE rH ШУН) ЮТ Fa —i ë 
l 

і=0, j=0; 

while(i<255) 


if(*(pdTran + i + 1)!=-1) 


1++; 
continue; 
J 
j = 1; 
while((*(pdTran + i + j)==-1)&&((i + j)<=255)) 


*(pdTran + i + ј)=*(ратгап + i); 
ј++; 
J 
J 
J 


// X E BNR E EITA E ET а EITEM, 
for (i=0; і<т pBMIH->biHeight; i++) 
l 


for (j=0; j<m_pBMIH->biWidth; j++) 


dTemp = ө; 
gray = GetGray(j, i); 


for (BYTE k=0; k<gray; К++) 


{ 
dTemp+=*(pdHist + к); 


}; 
target = *(pdTran + (int)(255 * dTemp)); 


if (target < Ө) target = ө; 


if (target > 255) target = 255; 


// 写 入 目标 图 像 
pTo->SetPixel(j, i, RGB(target, target, target)) 


} 
}; 


return true; 


本 书 同时 也 提供 了 Histst0 的 一 个 重 载 方法 ， 它 
接受 CImg 类 型 指针 作为 竺 此 配 直 方 图 的 标准 图 像 ， 
实现 如 下 。 





人 


BOOL CImgProcess::Histst(CImg* pTo, CImg* pStd) 
功能 : 图 像 的 灰 度 直方 图 规定 化 方法 
参数 : CImgProcess * pTo: 输出 CImg 对 象 的 指针 


CImgProcess* pStd: 标准 目标 网 像 
返回 值 : ”BOOL 类 型 ，TRUE 为 成 功 ，FALSE 为 失败 


人 


BOOL CImgProcess::Histst(CImg* pTo, CImg* pStd) 


{ 
// 标准 图 像 直 方 图 
double pdStdHist[256]; 


pStd->GenHist(pdStdHist); 


return Histst(pTo, pdStdHist); 
J 





利用 HiststO 函 数 实现 直方 图 规定 化 的 完整 示例 
# 26 (EDIPDemo LFE АУА 42 ра 23 
CDIPDemoView::OnPointHistst ()， 其 中 调用 Histst() 
图 数 的 代 但 请 断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 和 直方 图 规定 化 
imgInput.Histst(&imgOutput, pdStdHist); 


// stdImage 为 竺 匹配 直方 独 的 标准 图 像 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 选择 
一 幅 标准 图 像 。 读 者 可 以 通过 光盘 中 示例 程序 


DIPDemo 中 的 荣 单 命令 “点 运算 直方 图 规定 化 ?来 
观察 处 理 效 果 。 


ШИВ: ЖЕ Е ве E. 


第 4 章 ”图像 的 儿 何 变换 


包含 相同 内 容 的 两 幅 图 像 可 能 由 于 成 像 角 大 、 
КА Лв А Я РТА АНУ ЛЕ АС т E 
ВПК ЛУТА НИ, о а Аг Бе ЧИТЕ 
序 市 来 了 困扰 。 通 过 适当 的 几何 变换 可 以 最 大 程度 
地 消除 这 些 几 何 失 真 所 产生 的 负面 影响 ， 有 利于 恋 
者 在 后 续 的 处 理 和 识别 工作 中 将 注意 力 集 中 于 图 像 
的 内 容 本 刁 ， 更 确切 地 次 是 图 像 中 的 对 象 ， 而 不 是 
该 对 象 的 角度 和 位 置 等 。 因 此 ， 几 何 变 换 关 各 作为 
其 他 图 像 处 理应 用 的 预 处 理 步 骤 ， 是 图 像 归 一 化 的 
核心 工作 之 一 。 


本 章 的 知识 和 扩 术 热 操 


„шоты жи шан 
Ее Sy 


(2) 插值 算法 
(3) 图 像 配 准 
本 章 的 典型 案例 分 析 


(1) ETES RERA E 


(2) 汽车 牌照 的 投影 失真 校正 


41 解决 几何 变换 的 一 艇 思路 


图 像 儿 何 变 换 义 称 为 图 像 空 间 变 换 ， 它 将 一 幅 
图 像 中 的 坐标 位 置 映 射 到 万 一 幅 图 像 中 的 新 坐标 位 
前 。 尝 习 几 何 变 换 的 关键 束 是 要 硝 定 这 种 空间 映射 
天 系 ， 以 及 映射 过 程 中 的 变换 参数 。 


几何 变换 不 改变 图 像 的 像 系 值 ， 只 十 在 图 像 平 
面 上 进行 像 妹 的 重新 安排 。 一 个 几何 变换 需要 两 部 
分 运算 : 首先 征 至 间 变 换 所 需 的 运算 ， 如 平移 、 旗 
委 和 镜像 等 ， 需 要 用 它 来 表示 输出 图 像 与 输入 图 傈 
LEH RR) 有 映射 和 关系; ШУК, Мт НАУ 
皇 信 算法 ， 因 为 按照 这 种 变换 关系 进行 计算 ， 输 出 
Ti 


设 原 图 像 f (x 0 ,yo ) 经 过 几何 变换 产生 的 日 标 图 
像 为 g (х,у 1), MZEE (ШАҢ) 关系 可 表示 
为 : 


тү = 5(T0, Y0) 


(4-1) 


yı = (то, yo) 


(4-2) 


ЖЕН, s(xo; уб) (хо, yo) Afo.: Уо 
到 g (хт, у 1) АЁКА ИП, 4х 1 = s(x o 
‚ у0)=2х0, уу=ї(хо, уо) = 2у0 Ч, АН 
йд (хт, ，y1) 只 是 简单 地 在 x 和 y 两 个 空间 方向 上 
МЕ (хо ，y0) 的 尺寸 放大 一 倍 。 因 此 ， 旋 者 看 到 只 
要 掌握 了 有 关 变 换 函 数 s (xu уо) (хо, уо) 
1 元， 就 可 以 巡 循 下 面 的 步 又 实现 几何 变换 ，。 


算法 4.1 


根据 空间 变换 的 映射 和 关系， 确定 变换 后 目标 图 像 的 大 小 《〈 行 、 列 范围 
) ; // 有 些 变 换 可 能 改变 图 像 大 小 


rL АУ 5 


-1 


逐 行 扫描 目标 图 像 9g 


(X 


1 


) 中 的 每 一 点 (j 


›1 

o 

): 
ОТЕРИ 


рТ 
1 


) ; // 直 接 通过 映射 关系 计算 得 到 的 横 坐 标 ， 可 能 不 是 整数 


| 
Ж! 

| 

у; // 直 接 通过 映射 关系 计算 得 到 的 纵 坐标 ， 可 能 不 是 整数 


根据 选用 的 插值 方法 : 
(J 


) =interp(j 


yl 


' ); // 对 于 非 整 数 坐标 (j 


jl 


~x 


) їт e E 


If (j 


0 


) КВУ 


之 内 
ЖЯ ЛУ ж: g 





对 于 几何 失真 图 像 的 复原 校正 ) 过 程 正好 征 
ЖЛЕ ИЛЕ. 


то = s7! (T1. 11 | 


(4-3) 
yo = # (11,41) 


(4-4) 


IN (4-3) FIIN (4-4) 表示 相应 的 由 g (x1,y1) 
ФП (хо y o WEER., Н, ЧЕЙ S LAER ТП 
失真 的 图 像 g (x 1,y1) 是 谈 者 要 复原 的 对 象 ， 原 始 名 
| (x 0 yo) 是 旋 者 复原 的 目标 。 逆 变换 的 代 但 摘 述 
将 结合 车 牌 复 原 的 应 用 在 4.9 节 中 给 出 。 


对 服务 于 识别 的 图 像 处 理 而 言 ， 作 为 图 像 几何 归 一 
化 的 逆 变 换 过 程 的 应 用 常常 更 为 广泛 。 当 然 ， 在 变 
换 中 究竟 以 谁 作为 原始 图 像 fx 0 yo )， 以 谁 作为 变 
换 图 像 g (x 1 ,y 1 ) 并 不 是 绝对 的 ， 这 完全 取决 于 读者 
在 分 析 特 定 问 题 过 程 中 的 立场 。 比 如 说 对 于 图 4.1 中 
的 两 幅 图 像 ， 一 般 的 做 法 是 以 图 4.1 (а) 为 原始 图 

像 ， 图 4.1 b 为 变换 图 像 。 这 是 因为 在 图 

4.1 (b) 中 读者 关心 的 对 象 〈 数 字 和 字母 ) 处 于 一 

个 便于 观察 的 角度 〈 正 的 ) 。 但 我 们 也 完全 可 以 将 
图 4.1 (b) 视 为 fx ouyo)， 而 图 4.1 (а) 视 为 g (x 1 ， 
)。 此 时 ， 相 应 的 映射 关系 s 和 t 也 会 发 生变 化 。 





图 4.1 ДЕЕ BU) НОА ИЖ 


ЧА С 3.777) 用 于 消除 几何 因 系 (视角 、 方 位 等 ) 
迄 成 的 图 像 外 观 变化 时 ， 称 为 《图 像 ) 几何 归 一 化 ， 它 能 够 排除 对 象 
间 几 何 关 系 的 兰 列 ， 找 出 图 像 中 的 那些 几何 不 变量 ， 从 而 得 知 这 些 对 


ЖОН. Ае ЕНУ ЕЛЕ FAHER 


42 ”图 像 平移 


图像 平移 就 是 将 图 像 中 所 有 的 点 按照 指定 的 平 
PEKERE EHZ). 


4.2.1 ”图 像 平移 的 变换 公式 


(хо, yo ) 为 原 图 像 上 的 一 点 ， 图 像 水 平 乎 移 量 
为 人 ， 垂 百 平 移 量 为 及 ， 如 图 4.2 所 未 。 
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4.2 ”平移 变换 坐标 图 
则 平移 之 后 的 点 坐标 (x |, y 1 ) 变 为 : 


я = то — Ty 
yı = yo — Ty 


(4-5) 


HEIERI”: [x1 y i 1]=[xo yo 1 


(4-6) 
we КАИ, H AREER: [хо yo 
1]=[х 1 JV] 1| | -т, ~t | | 
(4-7) 
即 үк 
(4-8) 
这 样 ， 平 移 后 的 目标 图 像 中 的 每 一 点 都 可 以 在 
原 图 像 中 找到 对 应 的 点 。 例 如 : 对 于 新 图 中 的 (i ,j) 
像素 ， 代 入 上 面 的 方程 组 ， 可 以 求 出 对 应 原 图 中 的 
йж (С-Т,, ]-Т,) 。 而 此 时 如 果 T 大 于 i 或 大 


Fj. WA (i -Tk，j-Ty ) 超出 了 原 图 的 范围 ， 可 
以 直接 将 它 的 像素 值 统 一 设置 为 0 或 者 255。 
对 于 诛 图 中 被 移出 图 像 显 示 区 域 的 点 通 第 也有 


两 种 处 理 方法 ， 可 以 直接 丢弃 ， 也 可 以 通过 适当 增 
加 目标 图 像 尺 寸 〈 将 新 生成 的 图 像 宽度 增加 Tx ， 高 


度 增加 T, ) 的 方法 使 得 新 图 像 中 能 够 包含 这 些 点 。 
在 稍 后 给 出 的 程序 实现 中 ， 本 书 采用 了 第 一 种 处 理 
方法 

4.2.2 ”图 保平 移 的 实现 


1. MATLAB 编 程 实现 


MATLAB 没 有 和 直接 用 于 图 像 平移 的 函数 ， 这 里 
给 出 了 一 个 基于 灰 度 形态 学 的 图 像 平 移 实 现 ， 供 有 
兴趣 的 读者 参考 ， 没 有 接触 过 灰 度 形态 学 的 朋友 可 
以 在 学 习 过 第 11 半 之 后 再 回 过 汰 来 考虑 这 个 算法 。 


% 图 像 平移 


A=imread('girl.bmp'); % 读 入 图 像 


%strel 用 来 创建 形态 学 结构 元 系 

%translate(SE, [y х]) 在 原 结 构 元 系 SE 上 进行 y 和 x 方 同 的 偏 移 
% 参 数 [88 58] 可 以 修改 ， 修 改 后 平移 距离 对 应 改变 

se= translate(strel(1), [80 50]); 


%imdilate ЖЖ" ЛЮК 

В = imdilate(A,se); 

figure; 
subplot(1,2,1),subimage(A); 
title(' 原 图 像 ' ) ; 
subplot(1,2,2),subimage(B); 
title(' 图像 平移 '); 





上 述 算法 的 平移 效果 如 图 4.3 所 示 ， 注 意 到 对 于 
耻 射 在 原 图 像 之 外 的 点 算法 直接 采用 黑色 СО) JH 
A. eR Н Ж S| Т tH ES] шл X 
Juk HJ 22 Ж o 


' Figure 1 
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2. Visual C++ 实现 
利用 Visual C++ 实现 图 像 平 移 的 代码 如 下 。 


ОЕ Et 


void CImgProcess: :ImMove(CImgProcess * pTo, int x, int 


y) 
功能 : ”平移 图 像 
注 : Иа БШ] ДУ 
参数 : СїтрРгосе<$5 * pTo: 处 理 后 得 到 的 图 像 的 CImgProcess 
指针 
int х: 水 平 右 移 距离 
int y: ЕҢ. ТЖЕ A 
返回 值 ， Ж 


КЕЕ ЕЕ ЕЕЕ ETETETT EEEE 


void CImgProcess::ImMove(CImgProcess* pTo, int x, int у 


) 


{ 
int nHeight = pTo->GetHeight(); 
int nWidth = pTo->GetWidthPixel(); 
int i, j; 
if(x>nWidth || y>nHeight) 
MessageBox(NULL "超过 图 片 大 小 ", "错误 " MB ОК | МВ ІСОМ 
ERROR); 
return; 
J 
for(i=0;i<nWidth;i++) 
{ 
for(j=0;j<nHeight;j++) 
{ 


if(i-x>0 && i-x<nWidth && j-y>0 &&j-y<nHeight) 
pTo->SetPixel(i,j,GetPixel(i-x,j-y)); 
else 
pTo->SetPixel(i,j,RGB(255, 255, 255)); 
}//for j 


}//for i 
J 


ImMove() eK ZHY V 27 201 КРТ. 


// 调用 ImMove( ) 函 数 实现 图 像 平 移 
imgInput.ImMove(&imgOutput, 1XOffset, lYOffset); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “几何 变换 -图像 平移 "来 观察 处 理 效果 


43 НИ 


АРА М УУК БАЛЛИ А 18. KF a 
像 即 将 图 像 左 半 部 分 和 右 半 部 分 以 图 像 竖 直 中 轴线 
为 中 心 轴 进行 对 换 ， 而 竖 直 镜像 则 是 将 图 像 上 半 部 
分 和 下 半 部 分 以 图 像 水 平 中 轴线 为 中 心 轴 进行 对 
换 ， 如 图 4.4 所 示 。 





(a) 水 平 镜像 坐标 图 (b) ЕИ 
图 4.4 镜像 变换 ， 其 中 心 炎 在 图 中 以 虚线 标 出 


43.1 疼 像 镜像 的 变换 公 却 
Ф 水平 镜像 的 变换 关系 为 : 


一 ] 0 0 
0 1 Ü | 


[x 1 y 1 1 |=[х 0 y 0 1| | Width 0 1 | =| Wid 
-X0 yo 1 


(4-9) 


“Ж 20201051]: [xo yo 1]=[x1 уі 1 


0 1 Ü 


_ 1 上 Ú 
| Width 0 1 ) уш -Х 1 У 1 1] 


(4-10) 


Ф SERBIERA nj J А НИИ J EA WI 
F: 


1 0 0 


0 -1 0 
[x ] Yı 1|=[х 0 Уо | 0 Height 1 | =|x 0 
Height -yo 1] 


(4-11) 
WEN: [хо yo 1]=[x1 yı 1 
k k. J 
0 Height 1 =|x 1 Height -У 1 1] 
(4-12) 
4.3.2 图像 镜像 的 实现 
1. MATLAB 编 程 实 现 


Imtransform0 K Н F 5 2 ЕЧ ЯЕ [н] © 
换 ， 形 式 如 下 。 


B = imtransform(A,TFORM,method); 


° q. 为 要 进行 几何 变换 的 图 像 。 
空间 变换 结构 TFORM 指 定 了 其 体 的 变换 类 型 。 
° 。 可 选 参数 method fü VF 7Jimtransform() р 22 26 £ HJ 
插值 方法 ， 其 合法 值 如 表 4.1 所 示 。 


表 4.1 参数 methocl 的 合法 值 


'bili 双 线 性 插值 


这 些 插值 方式 的 具体 含义 请 参见 4.7 节 。 默 认 时 
为 双 线 性 插值 bilinear 。 


函数 输出 B 为 经 imtransformO 变 换 后 的 目标 让 
e 


可 以 通过 两 种 方法 来 创建 TFORM 结 构 ， 即 使 
Н такеіѓогт() K 21ср2( огт() р. ср2богтх — 
ЛИ о, E m И У НЕ [a] BU 
对 应 点 对 儿 作 为 输入 ， 用 于 确定 基于 控制 点 对 儿 的 
ару АЖ 64.87 НОЕ НА ЖТ 
介绍 ; И Н такегѓогт() A 32% 34% 








TFEORM 结 构 的 方法 。 


T=maketform(transformtype, Matrix); 


• 人 参数 transformtype 指 定 了 变换 的 闫 型 ， 如 第 见 
的 'affine' 为 二 维 或 多 维 仿 射 变 换 ， 包 括 平 移 、 旋 
转 、 比 例 、 拉 伸 和 错 切 等 。 

• Matrix НЛО Я АРА ВЕ 


ВАР АНЧИД К. 


% 镜像 变换 


A=imread('girl.bmp'); 

[height,width,dim]=size(A); 

tform = maketform('affine',[-1 0 @;0 1 Өө; width ө 1]); 
% X K ВАР [Е 

B = imtransform(A,tform,'nearest'); 

tform2 = maketform('affine',[1 © 0;0 -1 Ө; © height 1]) 


ЕЕ PE pa A a ye [Е 
imtransform(A,tform2,'nearest'); 

subplot(1,3,1),imshow(A); 

title(' 原 图 像 ' ) ; 

subplot(1,3,2),imshow(B); 

title(' 水 平 镜 象 '); 

subplot(1,3,3),imshow(C); 

title('e P 4); 





运行 结 
行 结果 如 图 4.5 所 示 。 


j) Figure 1 


File Edit View Insert Tools Desktop Window Help 
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2. Visual C++ 实现 


(1) 水 平 镜像 的 Visual C++ 实现 。 





J ŽE F K KE K K K K K K KK K K K K K 


void CImgProcess::HorMirror(CImgProcess * pTo) 
功能 : ”图 像 的 水 平 镜像 
注 : 图 像 左 右 镜 像 


参数 : СІтвРгосеѕѕ * pTo: 处 理 后 得 到 的 图 像 的 CImgProcess 
外 
BREE: 无 
人 
void CImgProcess::HorMirror(CImgProcess* pTo) 
{ 
int nHeight = pTo->GetHeight(); 
int nWidth = pTo->GetWidthPixel(); 


int i, J; 
int u; 
for(i=0;i<nWidth;i++) 
{ 
u=nWidth-i-1; 
for(j=0;j<nHeight; j++) 


pTo->SetPixel(i,j,GetPixel(u,j)); 
}//for j 
}//for i 


HorMirror( 4 871 HJ J 201 F EZR o 


// 调用 HorMirror() 函 数 实 现 图 像 水 平 镜 像 
imglnput.HorMirror(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





庄 者 可 以 退 过 示例 程序 DIPDemo 中 的 洒 早 命令 “ 几 


何 变 换 > КБЖ” ЖАЙ ЖХ aR AY Ж. 


(2) 竖 百 镜像 的 Visual C++ 实现 。 


六 


void CImgProcess::VerMirror(CImgProcess * pTo) 
功能 : ЖАЛЕЕТ 
Ë 图 像 上 下 镜像 
CImgProcess * pTo: 处 理 后 得 到 的 图 像 的 CImgProcess 


ккк ЕЕЕ ЕЕ КЕ ЕЕ ЕЕЕ ЕЕ 


void CImgProcess::VerMirror(CImgProcess* pTo) 
{ 

int nHeight = pTo->GetHeight(); 

int nWidth = pTo->GetWidthPixel(); 


Thi py 2J5 
int u=0; 
for(i=0;i<nWidth;i++) 


for(j=0;j<nHeight; j++) 


u=nHeight-j-1; 
pTo->SetPixel(i,j,GetPixel(i,u)); 
}//for j 
}//for i 





УегМіггог() вА 871 HJ J 2 F EZR o 





// 调用 VerMirror() 函 数 实现 图 像 竖 直 镜 像 


imgInput.VerMirror(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 示例 程序 DIPDemo 中 的 来 蛙 命 
«ЛЛАР — ERA ЖАЙ ЖЕ ДЕБЕШ К. 


44 ”图 像 转 置 


图 像 转 置 是 将 图 像 像 系 的 x 坐标 和 y 坐标 互 
换 ， 如 图 4.6 所 示 。 图 像 的 大 小 会 随 之 改变 一 一 高 度 
和 宽度 将 互 换 。 








4.6 FEMA ЕЁ 


441 8 ДАЈАНА ИУ 
转 置 变换 的 公式 如 下 : 


0 1 Ü 
1 Ü O0 


(хі yı 1)=(xo Уо "t i ) хо 1) 


(4-13) 


U 1 0 


显然 ， | о зверь 
Я. ЕАР Ji ea АН ЛН EIE. 


442 ”图像 转 置 的 实现 
1. MATLAB 编 程 实现 
转 置 变 换 的 实现 程序 如 下 。 


% 图 像 转 置 


A=imread('girl.bmp'); 
tform = maketform('affine',[9 1 0;1 © ө; © © 1]); 
AE N FE а ¿De k [Е 


В = imtransform(A,tform,'nearest'); 


ѕирр10+ (1,2,1), ітѕһом(А); 
title(' 原 图 像 ' ) ; 
subplot(1,2,2),imshow(B); 
title(' 图像 转 置 '); 





转 曾 结 朵 如 图 4.7 所 示 。 


TEEF JHR 
File Edit View Insert Tools Desktop Window Не1р 


zs b Aana El ПВ = mD 





47 转 置 效果 图 
2. Visual C++ 实 现 


利用 Visual C++ 实现 图 像 转 置 变 换 的 程序 如 





[етк ЕЕЕ ЕЕЕ ЕЕ 


void CImgProcess::Transpose(CImgProcess * pTo) 
功能 : BARRE. 
注 : НИЖУ ны, BURK NAA 


参数 : СїтрРгосе<$5 * pTo: 处 理 后 得 到 的 图 像 的 CImgProcess 
指针 
返回 值 : Ж 


ee 


void CImgProcess::Transpose(CImgProcess* pTo) 
l 

int nHeight = pTo->GetHeight(); 

int nWidth = pTo->GetWidthPixel(); 


int i, J; 
for(i=0;i<nWidth;i++) 


l 
for(j=0;j<nHeight; j++) 


if(j<nWidth && i<nHeight) 
pTo->SetPixel(i,j,GetPixel(j,i)); 
else 
pTo->SetPixel(i,jJ,RGB(255,255,255)); 
}//for j 
}//for i 


Transpose0O 函 数 的 调用 方式 如 下 所 示 。 


// 调用 Transpose() 函 数 实现 图 像 的 转 置 
imglnput.Transpose(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





A H| Pipih s ИЕ ОІРрето Н. 
«ЛАА ИЕА. 


在 学 习 了 4.6 节 图 像 旋 转 之 后 ， 有 兴趣 的 读者 也 
可 尝试 通过 先 水 平 镜像 ， 再 逆 时 针 旋转 90° 的 方式 
来 实现 图 像 转 置 。 

45 К АНИ 


图 像 缩放 是 指 岁 像 大 小 按照 指定 的 比率 放大 或 
者 缩小 ， 如 图 4.8 所 示 。 





4.8 šJ EA A PE ES 
4.5.1 838) uJ 28 л sÑ 


假设 图 像 x WI H| J 38 rS, , y H A 
JENES, > AHIASKA т\ у: 


sr 0 0 
0 5, 0 | 


хт yı ll=lxo Уо d O 0 ае, 


х ] | 
(4-14) 


Ж ЫИ ШП F: 


+ 0 0 
| 0 = ,| ыо, 
хо уо Hiki yı Шо 01/= 5 Ч 
(4-15) 


ААИ Дд АМИ RIRA НАХИ, Ж 
些 映 射 原 坐标 可 能 不 是 整数 ， 从 而 找 不 到 对 应 的 像 
素 位 置 。 例 如 : 当 S =S, 二 2 时 ， 图 像 放大 2 倍 ， 放 
大 图 像 中 的 像素 (0，1) 对 应 于 原 图 中 的 像素 
(0，0.5) ， 这 不 是 整数 坐标 位 置 ， 目 然 也 就 无 法 
提取 其 灰 硫 值 。 因 此 操作 者 必须 进行 菜 种 近似 处 
理 ， 一 种 简单 的 策略 是 直接 将 它 最 邻近 的 整数 坐标 
位 置 (0, 0) 或 者 (0, 1) 处 的 像素 灰 度 值 赋 给 
它 ， 这 束 是 所 请 的 最 近邻 插值 。 当 然 还 可 以 通过 4.7 
节 将 介绍 的 其 他 插值 算法 来 近似 。 


4.5.2 BHA AE MAISE EN 


1. MATLAB 编 程 实现 


Ай ЛХЛЕ 5 УХ Н] Sr ИЛЕШ JL i rB E HJ BJ 
imtransform() 了 水 数 来 实现 。 此 外 ，MATLAB 还 提供 
了 专门 的 图 像 绚 放 函 数 imresize()， 具 体 调 用 形式 如 
| 


B=imresize(A, Scale, method); 


° 参数 A JJ 41 АНЛА) ДАН ЧИ < 

• Scale 为 统一 的 缩放 比例 。 

° 0715 2: тењоаН F Ximresize0 A 19 х= УН 
EDE, HARE MlimtransformO K Ж, {НХ 
认为 最 近邻 插值。 


ШШ B АНЛА IENS - 


下 面 给 出 图 像 等 比例 缩放 的 MATLAB 编 程 实现 
的 代码 。 


% 图 像 缩 放 


A = imread('girl.bmp'); 
В = imresize(A,1.2,'nearest'); 


% 图 像 扩 大 1.2 倍 
figure,imshow(A);title(' 原 图 像 '); 
figure,imshow(B);title(' 4/2480 '); 





程序 运行 结果 如 图 4.9 所 示 。 





图 4.9” 绚 放 变 换 效 来 图 


如 果 和 希望 在 x 和 y 方 回 上 以 不 同比 例 进行 缩 
放 ， 可 使 用 如 下 方式 调用 imresize() 函 数 。 


B = imresize(A,[mrows ncols],method); 


回 量 参数 [mrows ncols] 指 明了 变换 后 目标 图 像 
B 的 具体 行 数 〈( 高 ) АШУ) (Си), ан 与 等 比 
例 缩放 时 的 调用 相同 ， 这 里 不 再 歼 述 


2. Visual C++ 实现 


利用 Visual C++ 实现 图 像 的 等 比例 缩放 的 代码 
如 下 。 


ООА 


void CImgProcess::Scale(CImgProcess * pTo,double times) 
功能 : ”图 像 的 等 比例 缩放 
注 : 包括 扩大 缩小 ， 图 像 大 小 不 变 
参数 : СІтвРгосеѕѕ * pTo: 处 理 后 得 到 的 图 像 的 CImgProcess 
H £T 
double times: 缩放 因子 
返回 值 ， Ж 


ккк ЕЕ ЕЕЕ КЕ ЕЕ ЕЕЕ ЕЕ 


void CImgProcess::Scale(CImgProcess* pTo, double times) 
l 

int nHeight = pTo->GetHeight(); 

int nWidth = pTo->GetWidthPixel(); 


int Ly J3 


for(i=0;i<nWidth; i++) 
{ 
for(j=0;j<nHeight; j++) 
{ 
if(int(i*1/times+0.5)<nWidth && int(j*1/times+ð. 
5)<nHeight) 
pTo->SetPixel(i,jJ,GetPixel(int(i*1/times+0.5 
y,int(j*1/times+0.5))); 
else 
pTo->SetPixel(i,j,RGB(255,255,255)); 
}//for j 
}//for i 


Scale Pq 819 5а F TZR o 


// 1 5са1е() РЯ 
imglnput.Scale(&imgOutput, Ғ2оотКа+іо); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





恋 痢 可 以 通过 示例 程序 DIPDemo 中 的 六 蛙 命 
«ЛЛАР — BREDO RM ЕУ 
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КЛЕТ — ЕНИ ЧИТ 6 TR AE SA EE 
一 定 的 角度 。 旋 转 通 第 也 会 改变 图 像 的 大 小 。 和 4.2 
太 中 图 像 平 移 的 处 理 一 样 ， 可 以 把 转 出 显示 区 域 的 
~ 也 可 以 改变 输出 图 像 的 大 小 以 扩展 显示 






NG... 
ум TS 
AYNISI 


€ 


4.10 ”旋转 变换 坐标 图 


4.6.1 以 原点 为 中 心 的 图 像 放 园 


如 图 4.10 所 示 ， 点 Po (xo0 уо) ИА 
Fe ЛӨ 到 点 也 1 (x 1, Y1 Je 


SL = ОР r + у? Ш: sina = WL, cos x = rg/ L 


FIAP 1 点 后 ， Д: sin(a Te у= /L =cosSa Sina. 十 S1T 


9 COSa 
(4-16) 
cos (a +0 )=zl /L =соѕ0 cosa -sin0 sing 
(4-17) 
令 L=1， 则 cosa =X o Sin,=yo 
FEA: 
| ті = cos Ü то — sin Ө yo 
у = cos yo + sin 0 то 
(4-18) 


从 而 得 出 旋转 变换 公式 为 : 


一 SB cos 0 


| сов) smë U | 
[x 1 J1 1|=[х 0 УО 1 | 0 0 1 
(4-19) 


МАЛУ, KESAN: 


Cos —sing 0 ` 
sn сов) 0 


хо yo 11]=[Х1 yı | м. Б 


(4-20) 


4.6.2 DER AIP CHI ENA DEFE 


在 4.6.1 小 下 中 给 出 的 旋 苇 征 以 坐标 原点 为 中 心 
进行 的 ， 那 么 如 何 围 经 任意 的 指定 点 来 旋转 呢 ? 将 
平移 和 旋转 操作 相 结合 即 可 ， 即 先进 行 坐 标 系 平 
移 ， 再 以 新 的 坐标 原点 为 中 心 旋 较 ， 之 后 将 新 原 操 
平移 回 原 坐 标 系 的 原点 。 这 一 过 程 可 归纳 为 以 下 3 


个 步 又。 
(1) 将 坐标 系 I 变 成 II。 
(2) 将 该 点 顺 时 针 旋 转 6 角 。 
(3) АПАЎ Н. 


ТВ РД 26 rh la НЕ Ре А], АЖ 
Тл. ВН ЕН) ЕЕ ш» WHEQ441PC4, МАЈ 
КИЛ Еу ДА, [АЈА ух HESH, Tj Һу 
EJH; ПАА А хе ABRI POD ЈА дА, M 
右 为 x IEJ H, HEY IENE. ЖАА І 
与 坐标 系 工 之 间 的 转换 天 系 如 何 呢 ? 





xil 


yl 
44.11 两 种 坐标 系 间 的 转换 天 系 


设 疼 像 的 宽 为 w , ma zjh, ， 则 容易 得 到 : 
11° 1 f 1 0 0 
yd = | adli 0 一 Ü 
1 1 0.5w: 0.5% 1 


ТН ДУ Ji 239 7J: 


(4-21) 


тії O гі 1° l 0 O 

| к= |а 0 р 0 

1 | —0.5w 0.54 1 
(4-22) 


全 此 ， 拘 作者 已 经 实现 了 上 述 3 个 步 又 中 的 第 1 
z 12832, ЛИЕ 2522 ЈЕ ЕАР au t / 155 
Иа АРЛ, ТЕВЕ И E ze 
ЗА ЕН 2 ЭН ЭЗ t Е PEHI 22 HX < 


T] TO 1 g g cosi) —sin(@) Ü l 0 g 
йш | ==. 7 0 —1 g sinif) cosg) O 0 —] g 
1 1 —0.5Wold 0.5Hold 1 0 0 1 O.5W леш 0.5Hnew 1 


原 图 像 和 新 图 像 的 宽 和 高 。 
上 式 的 逆 变 换 为 ; 


| zo T1 1 0 О | | соз(#) sinig) 0 | 1 0 0 
yo | = | T U 一 ] U —sin{ð) cos[(0) 0 0 一 ] (0 
1 1 —0.5Илеш 0.5Hnew 1 0 0 1 0.5Wold 0.5Hold 1 


(4-24) 


这 样 ， 读 痢 束 可 以 根据 上 面 的 迎 变 换 公 式 ， 按 
照 算法 4.1 中 的 描述 来 实现 围绕 图 像 中 心 的 旋转 变 
м” 可 以 进一步 得 出 以 任意 点 为 中 心 的 旋 
转变 换 。 


4.6.3 BMA DEFE HI KHL 


ЕАР J ЖС AANE 27 12 НЧ ИА 
ХНН ч, Аа ВУЛЕ НЗ е 04 
А, ТЕА. ПЕН ДШ Ж ИА У Е 
转变 换 的 效果 比较 。 
1. MATLAB 实 现 

可 通过 4.6.2 中 学 习 的 方法 设置 适当 的 变换 结构 
TFORM， 从 而 调用 imtransform 0 函数 来 实现 以 任 
意 点 为 中 心 的 图 像 旋转 。 此 外 ，MATLAB 还 专门 提 


供 了 围 线 图 像 中 心 的 旋转 变换 孙 数 imrotate()， 其 调 
用 方式 如 下 。 


B=imrotate(A,angle,method, 'сгор'); 


° А ЕЕ ENZ - 


L ‚ Mijimrotate) р ZE Е Л ај yg 9 

像 。 

° 日 和 这 人 参数 method 为 imrotateO0 函 数 指定 的 插 信 方 
Ze 

° rop AMARI JEF а ЛӘ ЖЕЕ , TE 42 BJ 
КЧ li L K y E. 


下 面 给 出 图 像 旋 转 的 MATLAB 编 码 实现 。 


% 围绕 中 心 后 的 图 像 放 转 


A=imread('girl.bmp'); 
а ИН ЙЕ} 30°, FEIW RA 


В=ітгоЁа+е(А, 30, 'пеагеѕі', 'сгор'); 


ѕирр10+ (1,2,1), ітѕһом(А); 
title(' 原 图 像 '); 
subplot(1,2,2),imshow(B); 
title(' 逆 时 针 旋 转 36?°'); 





程序 运行 结束 如 疼 4.12 上 所 示 。 


) Figure 1 
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44.12 ”旋转 变换 效果 图 
2. Visual C++ 实 现 


利用 Visual C++ 实 现 以 原点 为 中 心 的 图 像 的 旋 
转 代 人 码 如 下 。 


u ki ia i ЕН КЕЕ 


void CImgProcess::Rotate(CImgProcess * pTo,float ang) 


功能 : ”以 原 后 为 中 心 的 图 像 旋 转 
注 : 围 经 直上 项 点 顺 时 针 旋 转 ， 图 像 范围 不 变 
参数 :  CImgProcess * pTo: 处 理 后 得 到 的 图 像 的 CImgProcess 
& 
att 
float ang: 顺 时 针 旋 转角 度 ， 单 位 度 ， 要 求 ang>=8 && 

ang<=360 
BEE: Ж 
ЖОЕ SS SSS SSE) 
void CImgProcess::Rotate(CImgProcess* pTo,float ang) 
l 

int nHeight = pTo->GetHeight(); 

int nWidth = pTo->GetWidthPixel(); 


int i, j; // 目 标 图 像 坐 标 
int u,v; // 源 图 像 坐标 


for(i=0;i<nWidth;i++) 


l 
for(j=0;j<nHeight;j++) 


u=int(i*cos(ang*PI/180)+j*sin(ang*PI/180)+0 
.5); 
v=int(j*cos(ang*PI/180)-i*sin(ang*PI/180)-+0.5); 

if(u<nWidth && v<nHeight && u>=0 && v>=0) 
pTo->SetPixel(i,j,GetPixel(u,v)); 
else 
pTo->SetPixel(i,j,RGB(0,0,0)); 

}//for j 
}//for i 


Rotate) РА 217799 Jy Ra F РТЛХ 


// Ў Ко+ате() 5219 
imgInput.Rotate(&imgOutput, iRotateAngle); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 示例 程序 DIPDemo 中 的 玉 蛙 命 
«ЛААР. КИЛЕР” ЖАЙ ЖК АКИ А Н. 
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实现 几何 运算 时 ， 有 两 种 方法 。 第 一 种 称 为 回 
前 映射 法 ， 其 原理 是 将 输入 图 像 的 RR 
个 像 双 地 转移 到 输出 图 像 中 ， 即 从 原 图 像 坐标 计算 
出 目标 图 像 坐标 : g (x1y1)=f(a(xoyo0)b(xoy 
к эни Жинн 
У о 


ККА ТАЈ ЛЕ Н h, Е рар Bi Bh H] 240 
НАЈ, В У УДЫ Я Ја) А. rH, 
UR У H z< ШАН] EIA 28 А.Е) ЖЕЕ 
Fe Ay AA ERE RRR л, UZ E E B i ЖАГ 
ek AWAJ Е АТЛЕТ, xed. HH ЇН] 
后 映射 法 是 逐个 像素 产生 输出 网 像 ， 不 会 产生 计算 
良 忱 问题 ， 所 以 在 缩 放 、 放 转 等 操作 中 多 采用 这 种 
方法 ， 本 书 中 采用 的 也 全 部 为 向 后 映射 法 。 


Жа 2Г?НЗЛЁ A 1А] НИЕ УЛА, АЙШЕ 
好 的 算法 一 般 需 要 较 大 的 计算 量 。 


4.7.1 最 近邻 插值 


这 征 一 种 最 简单 的 插值 算法 ， 输 出 像 系 的 人 为 
输入 图 像 中 与 其 最 邻近 的 采样 点 的 像 系 值 。 例 如 ， 
图 4.13 中 的 点 Po 在 几何 变换 中 被 映 册 全 上 扣 P 1'， 但 
由 于 操 P1' 处 于 非 整 数 的 坐标 位 置 ， 无 法 提取 其 像 
素 灰 度 信 。 上 所 以 可 以 用 与 P1 ' 最 邻近 的 采样 点 P1 的 
灰 度 值 近 似 作为 P 1 'WJ2K 248 с 


a> 
> 

Ф 
2 
> 


Д. 
s 





图 4.13 ”最 近邻 插值 示意 图 


攻 近 邻 插值 可 表示 如 下 。 


f (x,y ) = g ( round(x ), round (y ) ) 


(4-25) 


А-ТЕ С.Н НАРА АЈУІѕиаї C++ 实现 中 采用 
的 培 为 最 近邻 插值 ， 它 计算 简单 ， 而 且 在 很 多 数 情 
况 下 的 输出 效果 也 可 以 接受 。 然 而 ， 最 近邻 手 值 法 
会 在 网 像 中 产生 人 为 加 工 的 痕迹 ， 详 见 例 4.1。 


4.7.2” 双 线性 插值 
1. 理论 基础 


双 线 性 插值 义 称 为 一 阶 插值 ， 古 线性 插值 扩展 
到 二 维 的 一 种 应 用 。 它 可 以 通过 一 系列 的 一 阶 线性 
皇 人 得 到 。 

线性 〈linear) ， 指 量 与 量 之 间 按 比例 、 成 直线 的 天 系 ， 在 数学 上 


可 以 理解 为 一 阶 导数 为 弟 数 的 函数 ;线性 插值 则 是 指 根据 两 个 点 的 值 
线性 地 确定 位 于 这 两 个 点 连 线 上 的 东 一 点 的 值 。 


ИШ Ж Ж ШИИ ЖИА. БИЖ H ЁБ A E БОЛ [у2хХ2 
BERAN ЖЕЕ АЖ AKEE НУЛА ЕУ). 


设 已 知 单位 正方 形 的 顶点 坐标 分 别 为 f (0,0)、f 
(1,0)、f(0, 了 )、f(1,1)， 如 图 4.14 所 示 ， 本 节 要 通过 





44.14 ”线性 插值 示意 图 
自 完 对 上 闹 的 两 个 点 进行 线性 插值 得 到 : 
f (x ,0)= (0,0)+x [f (1,0)-f (0,0)] 
(4-26) 
再 对 下 端的 两 个 顶点 进行 线性 插 信 得 到 : 
f (x ,1)=f(0,1)+x [f (1,1)-f (0,1)] 
(4-27) 


最 后 ， 对 垂下 方 同 进行 线性 插 信 得 到 : 


(ху )=Í (x, 0)+y [f (x ,1)-f (x ,0)] 
(4-28) 
综合 式 〈4-26) £ Á (4-28) ， 上 整理 得 出 : 


f (х,у )= 17 (1,0)-f (0,0)]x +[f (0,1)-f (0,0)у +[f (1,1)+f 
(0,0)-f (0,1)-f (1,0)]ху +f (0,0) 


(4-29) 


上 面 的 推导 是 在 单位 正方 形 的 前 提 下 进行 的 ， 
入 加 变换 吏 可 以 推广 到 一 般 情 况 中 。 


线性 插值 的 假设 十 原 图 的 灰 度 在 两 个 像 系 之 间 
征 线性 变化 的 ， 蛙 然 这 古 一 种 比较 合理 的 假 议 。 因 
此 在 一 般 情况 下 ， 双 线性 插值 部 能 取得 不错 的 效 
来 。 喝 精确 的 方法 古 采 用 曲线 插值 ， 即 认为 像 系 之 
司 的 灰 度 变化 规 律 从 合作 种 曲线 方程 ， 当 然 这 种 处 
理 的 计算 量 征 很 六 的 。 


2. Visual C++ 实现 


利用 Visual C++ 实现 双 线 性 插值 的 代码 如 下 。 





ккк ed ЕЕЕ SS 


int CImgProcess::InterpBilinear(double x, double y) 


功能 : 双 线 性 插值 


参数 : double x: 需要 计算 插值 的 横 坐 标 
double y: 需要 计算 插值 的 纵 坐 标 
返回 值 : int 插值 的 结 


ОРОКЕ ЕЕ оу 


int CImgProcess::InterpBilinear(double х, double у) 


if(int(y)==300) 
іп сс = 1; 


// 4 个 最 临近 像素 的 坐标 (11, j1), (12, j1), (11, j2), (12, 
12) 
int х1, х2; 
int y1, y2; 


// 4 个 最 临近 像素 信 
unsigned char fl, f2, f3, +4; 


// 两 个 插值 中 间 值 
unsigned char f12, f34; 


double epsilon = 0.0001; 


// 计算 4 个 最 临近 像 系 的 坐标 
x1 = (int) x; 


x2 = x1 + 1; 
у1 = (int) у; 
y2 = y1 + 1; 


int nHeight = GetHeight(); 

int nWidth = GetWidthPixel(); 

if( (x < Ө) || (х > nwidth - 1) || (y < 0) || (y > 
nHeight - 1)) 


// ЭПИ SA AS tE Jp ўш ру, 25 [81-1 


} 


return -1; 


else 


返回 充 


值 即 可 


次 插值 


if (fabs(x - nWidth + 1) <= epsilon) 


// 如 末 计 算 的 点 在 图 像 右边 绿 上 
if (fabs(y - nHeight + 1) <= epsilon) 


{ 
// ЖТ ЕЕ в РА, Е 
БА ЖЇН. 
fl = (unsigned char)GetGray( х1, у1 ); 
return fl; 


) 


else 
{ 
// ЖЕ 162526 E НЛ т, Е 0 


f1 
f3 


(unsigned char)GetGray(x1, y1 ); 
(unsigned char)GetGray( x1, y2 ); 


// ЗИН 
return ((int) (fl + (y -у1) * (f3 - fl))); 
J 


J 
else if (fabs(y - nHeight + 1) <= epsilon) 


{ 
// 如 果 计算 的 点 在 图 像 下 边缘 上 且 不 是 最 后 一 点 ， 直 接 一 


BH HJ 
f1 = (unsigned char)GetGray( x1, y1 ); 
f2 = (unsigned char)GetGray( x2, y1 ); 


// 返回 插值 结果 
return ((int) (fl + (x -х1) * (f2 - fl))); 
J 


else 


// 计算 4 个 最 临近 像 系 值 


f1 = (unsigned char)GetGray( х1, y1 ); 

f2 = (unsigned char)GetGray( х2, у1 ); 

f3 = (unsigned char)GetGray( х1, y2 ); 

f4 = (unsigned char)GetGray( x2, y2 ); 

// 插值 1 

f12 = (unsigned char) (fl + (x - x1) * (f2 - fl) 
); 

// 插值 2 

f34 = (unsigned char) (f3 + (x - x1) * (f4 - f3) 
); 

// 插值 3 

return ((int) (fl2 + (y -у1) * (f34 - fl2))); 

J 
J 

J 


4.7.3 ЕН 


ТЕ Лнда Ну АТ Н, w Zk EJ BL ЕН 
作用 会 使 图 像 的 细 市 退化 ， 而 其 科 率 的 不 连续 性 则 
会 导致 变换 产生 不 希望 的 结果 。 这 些 都 可 以 通过 局 
ЭИА EIR АТИ E Н А ИС ЗЕН 
像素 的 信 为 输入 图 像 中 距离 它 最 近 的 4x4 领 域内 采 
样 点 像 系 信 的 加 权 平 均 介 。 


下 面 以 三 次 插值 为 例 ， 它 使 用 了 如 下 的 三 次 多 
项 式 来 帝 近 理论 上 的 最 住 插 值 子 数 sin(x )/x ， 如 图 
4.15 所 示 。 


1 — 2|:|“ + |а 0<|т|< 1 
S(z)= 4 4—8|z|+5|z|—|z 1< |z|<2 
() › 


| > 2 
(4-30) 


上 式 中 |x [= х Jr nu] g PK SA JEE A o 
待 求 像 系 (x y PIKE B ЕН ЖИ 11615 а НКЛ 
加 权 插 值得 到 。 计 算 公 式 如 下 : 
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44.15 EIME АЁ 
(х,у) =[(+иј +у) = АВС 


(4-31) 


5(1 +») \* 

a= | 5%) 
[a] 
HR,  \5@-), 


51+ ы) 
Slu) 
sa | 5(1 — ы) | 

5(2— u) 


fii—l,j— 1) fli—1.j) FE 一 17 二 1 fli —1,ў+32) ` 
2. fli.j— 1) fli, p) fü, j+ 1) flij+2) | 

fü + 1.j—1) fli+ 1.j) fü-+ 1l.j+ 1) fli-+ 1. j+ 2) 

fü+2,j—1) fü+2,j) fü+2,j+1) fü+2,j+ 2) 


三 次 插值 方法 过 第 应 用 在 光栅 喧 示 中 ， 它 在 允 
放任 草 比例 的 缩放 操作 的 同时 ， 较 好 地 你 持 了 图 像 
2177. 


[4.1] 插值 方法 的 比较 。 


A Figure 1 拼音 回回 四 
File Edit View Insert Tools Desktop Window Help w 
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44.16 ”插值 方法 比较 效果 图 1 


多 4.16 和 图 4.17 分 别 给 出 了 采用 最 近邻 、 双 线 
性 和 三 次 插值 时 对 于 两 幅 不 同 图 像 的 旋转 效果 。 从 
图 4.17 可 以 看 出 最 近邻 的 插值 方法 得 到 的 结果 还 是 
可 以 接受 的 ， 但 当 图 像 中 包含 的 像 系 之 间 灰 度 级 有 
明显 变化 时 〈 见 图 4.16) ， 从 结果 图 像 的 锯齿 形 边 
可 以 看 出 三 种 插值 方法 的 效果 依次 递 减 ， 最 近邻 插 
值 的 效 末 明显 不 如 另外 两 个 好 ， 锯 郊 比 较 多 ， 而 三 
次 插值 得 出 的 图 像 较 好 地 保持 了 图 像 的 细节 。 这 是 
财 为 参与 计算 输出 点 的 像 系 值 的 拟 合 点 个 数 不 同 ， 
个 数 越 多 效果 越 精 确 ， 当 然 参与 计算 的 像 际 个 数 会 
影 啊 计算 的 复杂 上 度 。 实 验 结 果 也 清楚 地 表明 : 三 次 
插值 法 花费 的 时 间 比 男 外 两 种 的 要 长 一 些 。 最 近邻 
和 线性 插值 的 速度 在 此 次 图 像 处 理 中 几乎 分 不 出 
来 。 所 以 ， 在 计算 时 间 与 质量 之 间 有 一 个 折 中 间 


ЕЙ ç 


j) Figure 1 
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双 线 性 插值 





4.17 ”插值 方法 比较 效果 图 2 


利用 MATLAB 实 现 上 述 3 种 插值 方法 用 代码 如 
Fo 





=imread('test.bmp'); 
imrotate(A,30,'nearest'); 
imrotate(A,30,'bilinear'); 
imrotate(A,30,'bicubic'); 


Чет ЗӨ? ИЕ YA E Ж 


А 
В 
С 
D 
% 


subplot(2,2,1),imshow(A); 
title(' 原 图 像 ') ; 
subplot(1,3,1),imshow(B); 
title(' 最 近邻 插值 ' ) ; 
subplot(1,3,2),imshow(C); 
title(' 双 线性 插值 '); 
subplot(1,3,3),imshow(D); 
title(' 三 次 插值 ' ) ; 
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换 。 而 本 节 将 要 介绍 的 图 像 配 准 技术 则 是 站 在 几何 
OR 
可 变换 。 


4.8.1 ”图 像 配 准 


所 谓 图 像 配 准 融和 是 将 同一 场 尿 的 两 幅 或 多 幅 图 
像 进行 对 准 。 如 舱 空 照 放 的 配 准 ， 以 及 在 很 多 人 朋 
目 动 分 析 系 统 中 的 人 腔 归 一 化 ， 即 要 使 各 张 照 上 请 中 
的 人 脸 呐 有 近似 的 大 小 ， 尽 量 处 于 相同 的 位 置 。 


一 般 来 说 ， 使 用 者 以 基准 图 像 为 参照 ， 并 通过 
一 些 其 准点 (Fiducial Points) 找到 适当 的 空间 变换 


天 系 s 和 ! ， 对 得 入 多 像 进行 相应 的 几何 变换 ， ш 
实现 它 与 基准 图 像 在 这 些 基 准点 位 置 上 的 对 齐 


下 面 束 以 人 上 脸 图 像 的 校准 为 例 ， 和 学 习 如 何在 
MATLAB 中 实现 图 像 配 准 。 


4.8.2 人 脸 图 像 配 准 的 MATLAB 实 现 


(1) 读 入 基准 图 像 和 要 配 准 的 输入 图 像 ， 结 
果 如 图 4.18 所 示 。 


>> Iin = imread('face2.jpg'); 
>> Ibase = imread('facel.jpg'); 
>> figure 


subplot(1, 2, 1), imshow(Iin); 
subplot(1, 2, 2), imshow(Ibase); 
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(2) 标注 基准 点 对 儿 ， 并 将 其 保存 至 工作 空 
间 。 


利用 MATLAB 提 供 的 cpselect0 了 水 数 可 以 交互 式 
地 选择 基准 点 。 在 命令 行 中 按照 下 面 的 方式 调用 
cpselect() 可 以 局 动 该 交互 工具 。 可 以 分 别 蛙 击 两 幅 
图 像 中 的 相同 部 分 选择 成 对 儿 的 其 准点， 如 眼睛 和 


跑 角 ， 如 图 4.19 所 示 。 


>> срѕе1есі(Ііп, Ibase); 
>> input _ points 


input_points = 


81.8988 89. 
130.8988 72. 
106.3988 139. 
144.8988 122. 


>> base points 

base points = 
64.1540 
112.1540 


72.1540 
107.1540 





= Control Point Selection Tool 
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注意 调用 时 要 将 需要 配 准 的 图 像 作为 第 一 个 参 
数 ， 将 基准 图 像 作 为 后 一 个 参数 。 还 有 一 点 束 古 
cpselectO 国 数 只 接受 灰 度 图 像 ， 如 条 需要 处 理 RGB 
彩色 图 像 ， 可 以 只 给 cpselect() 函 数 传递 图 像 的 一 个 
屋 。RGB 图 像 的 cpselectO 函 数 的 调用 语法 如 下 。 


>>cpselect( Irgb(:,:,1), Ibase); % 只 传递 输入 图 像 的 红色 分 


Е 


里 击 交 互 工具 “File” 玉 里 下 的 “Save Points to 
Workspace” 选 项 ， 可 以 将 之 前 选择 的 基准 点 对 儿 你 
和 仔 全 工作 容 间 。 默 认 情 况 下 ， 输 入 图 像 中 的 基准 点 
保存 在 变量 “input_points” 中 ， 基 准 图 像 的 基准 点 保 
存在 变量 “base_points” 中 。 


(3) 指定 要 使 用 的 变换 类 型 。 


根据 之 前 得 到 的 控制 点 对 儿 举 
\№“іпри роіпіѕ”#1“Ъаѕе роіпіѕ”, 4] ср2огт() р 
ТАРДУ ИЕ л А] ДЕ ЖИ ЛА 
圳 给 cp2tform()， 选 择 一 种 适当 的 变换 类 型 ， 
cp2tformO 〇 函数 束 能 够 硝 定 出 访 类 型 变换 所 需 的 参 
数 。 这 实际 上 相当 于 一 种 数据 拟 合 ，cp2tform0 〇 也 
数 寻 找 能 够 拟 合 控制 点 对 儿 的 变换 参数 ， 它 返回 一 
个 TFORM 结 构 的 几何 变换 结构 ， 其 中 束 包 括 了 几 
何 变 换 的 类 型 和 人 参数， 调用 cp2tform 的 代码 如 下 。 


>> tform = cp2tform(input points, base points, 'affine' 


); ЯТАР 





参数 'affine' 表 示 选 用 投影 变换 。Cpselect() 孙 数 
忌 共 文 持 6 种 类 型 的 变换 ， 包 括 线性 和 非 线 性 的 ， 
以 及 2 种 分 段 变换 ， 如 表 4.2 所 示 。 实 际 应 用 中 的 关 


е К-НА ЖКА u IS A т 2: Db Pe CT YE: HJ 
变换 类 型 。 


表 4.2 变换 类 型 及 其 说 明 





变换 类 型 运用 情况 


当 输 入 图 像 中 的 形状 没有 改 

ау, {НЮ ЮЧ FE ЛЕ 
linear 以 及 比例 缩放 等 变换 后 发 生 失 
conformal | 真 时 使 用 本 变换 。 变 换 后 直线 

平行 线 仍 为 平行 


当 输 入 图 像 中 的 形状 展示 出 错 

切 效 果 使 用 本 变换 。 变 换 后 下 
affine 线 仍然 是 直线 ， 平 行 线 仍 为 平 
-È 但 矩形 变 成 了 平行 四 边 

当场 景 显得 倾 料 时 使 用 本 变 
Projective | 换 。 变 换 后 直线 仍然 为 直线 ， 
一 但 平行 线 不 再 平行 


当 图 像 中 的 对 象 发 生 弯曲 时 使 
用 本 变换 。 拟 合 中 选用 的 多 项 
“| 式 的 阶 数 越 高 ， 拟 合 效果 越 
polynomial | 好 ， 但 配 准 后 的 图 像 比 基准 图 
像 包含 更 多 的 曲线 ， 同 时 也 需 
要 更 多 的 基准 点 对 儿 




























piecewise | 当 图 像 呈现 出 分 段 变 形 现象 时 
使 用 本 变换 


当 图 像 中 的 变形 具有 局 部 化 特 
护 ， 并 且 分 段 线 性 条 件 不 够 序 |2 
分 时 考虑 使 用 本 变换 


(4) 根据 变换 结构 对 输入 图 像 进行 变换 ， 移 
成 基于 基 人 准点 的 对 准 。 


调用 imtransform() 函 数 进行 变换 ， 调 用 代码 如 
下 。 从 而 实现 配 准 ， 逊 数 返 回 配 准 后 的 图 像 ， 如 图 
4.20 (a) 所 示 。 


>> Iout = imtransform(Iin, tform); 
>> figure 
subplot(1, 2, 1), imshow(Iout); 


subplot(1, 2, 2), imshow(Ibase); 





44.20 (b) 给 出 了 采用 投影 模型 (调用 
cp2tformO 函 数 时 第 3 个 参数 为 projective') 的 配 准 效 
果 ， 同 图 4.20 (а) 相 比 ，4 个 基准 点 的 对 齐 效 果 更 
好 ， 但 输入 图 像 的 变形 也 更 大 一 些 。 


jk Figure 2 
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(b) 水 用 投影 模型 


图 4.20” 配 准 后 的 图 像 


49 Visual С++ Zk w H 55 #il— 
汽车 牌照 的 投影 失真 校正 


本 贡 介 绍 一 个 汽车 牌照 自动 分 析 的 应 用 背景 ， 
操作 的 目标 是 识别 出 图 4.21 中 汽车 牌照 中 的 字符 。 
担 援 时 的 成 像 和 角度 决定 了 在 图 中 的 车 脾 有 发生 了 一 定 
FERRER REFR ARANHA, 
НЗ 2182617), FERFE IEE Fk. / Fë 
形 。 车 腺 中 的 字符 也 随 之 出 现 了 相应 的 投影 变形 ， 
导致 车 牌 字 人 符 在 不 同 角度 的 拍摄 独 像 中 呈现 出 窒 然 
不 同 的 外 观 ( 见 图 4.1) ， 这 无 疑 给 后 续 的 识别 工作 
带 来 了 极 大 的 困难 ， 而 且 过 度 倾 斜 的 图 像 也 给 后 续 
的 预 处 理工 作 ， 如 字符 分 割 ， 增 加 了 不 少 难度 。 


AR GN) 字符 的 识别 请 参考 本 书 第 15 章 人 
工 神 经 网 络 中 给 出 的 基于 ANN 的 数字 字符 识别 的 工 
时 案例 ， 这 里 不 考虑 识别 ， 只 天 心 竺 牌 图 像 的 几何 
归 一 化 问题 。 





图 4.21 汽车 牌照 的 投影 变形 图 像 


4.91 系统 分 析 与 设计 
1. 建立 投影 变换 模型 


在 4.1 太 和 曾 指 出 恢复 投影 变形 的 天 键 束 古 要 找到 
УКА (ЖМ) 图 像 之 间 的 关系 s (хо yo) 


ХЕ (x 0,y o) 一 旦 变换 天 系 s ЖШ NI, АН] ДД 
zÑ (4-1) Яй (4-2) 将 原 图 像 f (x0 yo) 中 的 每 一 


wR ERR Rg (x 1 y1) 2191, М 
KEMI НУ Jy 3k FRAMME. ZA 
而 在 实践 中 ， 得 到 关系 s (x 0 уо) (хо y0 ) 并 非 多 
事 。 首 先 一 些 较 为 复杂 的 几何 失真 是 很 难 通过 儿 个 
解析 式 来 描述 的 ， 即 很 难 对 这 样 的 失真 过 程 建 模 。 
此 外 ， 即 便 是 已 经 找到 了 用 于 摘 述 几何 失真 的 合理 
模型 ， 如 何 确定 该 模型 的 参数 将 是 又 一 个 杯 手 的 问 
题 。 

对 于 本 廊 将 要 讨论 的 投影 变形 ， 本 市 已 经 有 了 J 
и 即 通过 下 面 的 双 线 性 方程 来 
EI, 


Тү = 80240, 00) = c1z0 + cay0 + caroyo + ca 
у = та, Y0) = С570 + Ceyo + Сттоуо + Св 


(4-33) 


式 (4-32) 和 式 (4-33) 中 总 共有 8 个 参数 ，c 1 
,C2,.….,C 8。 如果 能 够 找到 4 对 儿 对 应 点 〈 基 人 礁 
A) ， 职 能 够 建立 8 个 方程 ， 解 出 c1 到 c g 这 8 个 参 
数 ， 从 而 确定 映射 关系 s (x 0 уо) (хо yo)。 为 此 
该 者 必须 至 少 知道 4 个 原 图 像 中 的 点 在 投影 失真 的 
图 像 中 被 映射 到 的 对 应 位 置 。 


ВЛАЕ Ж ЛЖ дА JU, — u 
图 像 生成 系统 存在 物理 的 人 为 缺陷 ， 如 金属 点 ， 馈 
RERE REE. РЕ Г ОАЕ Е, 
在 获取 的 图 像 中 这 些 点 的 位 置 是 容易 得 到 的 。 再 比 
如 说 对 于 图 4.21 中 的 汽车 牌照 图 像 ， 在 其 二 值 化 图 
像 中 用 霍 夫 变换 (参见 第 12 章 ) 检测 出 四 边 形 的 边 
框 线 ， 根 据 边框 线 的 交点 确定 四 边 形 的 4 个 顶点 ， 
将 其 作为 基准 点 将 是 一 个 不 错 的 选择 。 


简 蛙 起 见 ， 工 程 中 省 略 了 在 失真 图 像 中 寻找 基 
准点 的 过 程 ， 而 是 直接 在 图 中 以 交互 的 方式 确定 了 
牌照 边框 四 边 形 的 4 个 顶点 作为 基准 点 ， 从 大 上 角 
开始 按照 顺 时 针 方向 依次 为 : x (D1,y (D: ) = 
(108, 135), (x (2)1 Уу (2)1 ) = (274, 51), (x (3)1 ‚У (3)1 
) = (295, 119), (х (4), у (4); ) = (158, 248). 


对 于 原始 图 像 ， 假 想 其 中 的 一 个 矩形 区 域 作为 
投影 失真 的 车 牌 校正 后 的 目标 位 置 ， 由 于 已 知 一 自 
的 车 牌 宽 高 比例 为 3.1: 1 左右 ， 因 此 设 定 校 正 目 标 
ЕЛЖ е ЛЖ 24100, 8 27310, ИЖЕ НАА 
MIER: (х (Doy (o ) = (0, 0), (x (2)o , y (2)o ) 
= (310, 0), (x (3)0 , y (З)о ) = (310, 100), (х (4)0, y 
(4)0 ) = (0, 100). 


将 4 个 基准 点 对 儿 的 坐标 代入 式 (4-32), 


N 
Дш 


т{1)1 = str{tl)o, vtl)o)} = cizll1)o + cəwll)o + caz(ljoyll)o + са 
Tl2)1 = 81212 )0. 0(2)0) = ciz[2)o + cəw[2)o + car(2)oy(2)o + ca 


r(4)i = s(z(A)o,y(4)o) = ciz(4)o + cay(4)o + caz(A)og(4)o + ca 
= Ху = Xola 
从 而 可 以 解 出 前 4 个 变换 参数 : 
ы ү sa Ai 
(4-34) 


类 似 地 ， 将 4 个 基准 点 对 儿 的 坐标 代入 式 (4- 
33) ， 可 解 出 后 个 变换 参数 C5 一 8。 


2. 根据 模型 实施 变换 

ТЕ ЕЁ [ АР РА {5 (x 0,.V 0 )#llt (x 0, УО ) 的 全 部 
况 之 后 ， 由 投影 变形 图 像 g 恢复 原始 图 像 的 过 程 实 
际 上 束 走 算法 4.1 中 插 述 的 一 般 几 何 变 换 过 程 的 逮 过 
Fe, 下面 给 出 这 一 过 程 的 伪 代 公 插 述 。 


算法 4.2 





根据 空间 变换 的 映 冉 关系 〔 变 换 函 数 ) ， 确 定 变 换 后 上 日 标 图 像 的 大 小 


未 行 扫 插 原 妈 图 像 f 


(x 


0 
) 中 的 每 一 点 (j 


0 


0 
): 


l 
根据 空间 变换 的 映射 关系， 计算 得 : 
7 


1 


根据 选用 的 插值 方法 : 
(J 


1 


РК 


)=interp( j 


1 
) КВУ 


кА 
复制 对 应 像 系 : f 


Cj 


4.9.2 ”系统 实现 


下 面 依据 4.9.1 小 和 中 的 思路 一 步 步 地 来 实现 投 
КЕ Г ГЕ 


(1) pW2WGetProjPara)H T +L 5979 Р 17 
的 8 个 参数 。pPointBase 和 pPointSampl 分 别 为 基准 网 
像 的 基准 点 数组 和 投影 变形 图 像 的 基准 点 数组 。 解 


出 的 8 个 参数 存 入 动态 数组 pPDbProjPara 中 ， 并 以 人 参 
数 形式 返回 。 编 程 代码 如 下 。 


ИОА Т 


void CImgProcess: : беёРгојРага(СРоіпё* рРоіпЕВаѕе, CPoin 
tk рРоіпёѕатр1, double* pDbProjPara) 
功能 : 根据 基准 点 对 儿 《〈 对 儿 ) 确定 变换 参数 
参数 : CPoint* pPointBase: 基准 图 像 的 基准 点 
CPoint* pPointSampl: 输入 图 像 的 基准 点 
double* pDbProjPara: 变换 参数 
BREE: Ж 
кк ЕЕЕ КЕ ЕЕ ЕЕ ЕЕЕ 
void CImgProcess::GetProjPara(CPoint* pPointBase, CPoin 
tk pPointSampl, double* pDbProjPara) 
l 


int 1; 


// 投 影 线 性 方程 的 系数 矩阵 
double** ppParaMat; 
ppParaMat = new double*[m nBasePt]; 
for(i=0; i<m_nBasePt; i++) 
l 
ppParaMat[i| = new double[m пВаѕер+ |; 


for(i=0; i<m_nBasePt; i++) 
l 
ppParaMat[| i][9] = pPointBase[i].x; 
ppParaMat[i][1] = pPointBase[il].y; 
ppParaMat[i][2] = pPointBase[i].x * pPointBase[i]. 


У; 


ррРагамМаї [і | [3 | T; 


double* pResMat;// 结 果 和 矩阵 
PResMat = new Яоиб1е[т пВаѕер+ |; 
for(i=0; i<m_nBasePt; i++)// 计 算 前 4 个 系数 c1,c2,c3,c4 
{ 

рКеѕМа[1] = рРоіпёѕатр1[1].х; // 投 影 线 性 方程 的 信 X 
J 


// Hl 396 РЕ НОЕ RERI ЛЕЛЕ Hi ТЕЛЕЕ ИАЛ # 32% 
cl,c2,c3,c4 
InvMat(ppParaMat, т nBasePt); 
ProdMat(ppParaMat, pResMat, pDbProjPara, т пВаѕерР+, 
1，m_nBasePt);// 求 出 前 4 个 系数 


for(i=0; i<m_nBasePt; i++)// 计 算 后 4 个 系数 c5,c6,c7,c8 
pResMat[i] = pPointSampl[i].y; // 投 影 线 性 方程 的 值 y， 
J 
// KHER RDE EJ Е ВУАН ЭВА ВУД“ £ 25 
с5,с6,с7,с8 


ProdMat(ppParaMat, pResMat, pDbProjPara+m пВаѕер+, 
m_nBasePt，1，m nBasePt);// 求 出 后 4 个 系数 


/ /释放 空间 
delete[ | pResMat; 
for(i=0; i<m_nBasePt; i++) 
{ 
delete[ | ppParaMat|[ i]; 


delete[ | ppParaMat ; 


(2) InvMatO 函 数 用 于 实现 式 〈4-34) "ЕЖ 


Еа, YAH / Gauss-Jordan 7 YE. 281 
代 人 码 如 下 。 


pA i КЕК ЕЕЕ 


BOOL CImgProcess::InvMat(double** ppDbMat, int nLen) 
功能 : 计算 ppDbMat 的 逆 和 矩阵 


注 : ppDbMat 必 须 为 方 阵 

人 参数: double** ppDbMat: 输入 矩阵 
int піеп: 和 矩阵 ppDbMat 的 尺寸 

返回 值 : BOOL 


=true: 执行 成 功 
=false: 计算 过 程 中 出 现 错误 


i ea te 


BOOL CImgProcess::InvMat(double** ppDbMat, int nLen) 
double* pDbSrc = пем double|[nLen * nLen|; 
int *is,*js,1,J, k; 


/ / KA ЖЖ >K [Г] АЛЕ [EE 
int nCnt = 0; 
for(i=0; i<nLen; i++) 
{ 
for(j=0; ј<піеп; j++) 
pDbSrc[nCnt++] = рррБЬМа+ [1 ][5]; 
J 


double d,p; 
is = пем int[nLen]; 
js = new int[nLen]; 
for(k=0;k<nLen;k++) 
l 
d=0.0; 
for(i=k;i<nLen;i++) 


for(j=k;j<nLen;j++) 


p=fabs(pDbSrc[i*nLen + j]); // 找 到 绝对 值 取 大 的 系 


if(p>d) 
d = p; 
// 记 录 绝 对 值 最 大 的 系数 的 行 、 列 索引 
is[k] = i; 
js[k] = j; 
J 


if(d+1.0==1.0) 

{// 525-0, АЗ®ОЕЕ ЛӨ 阵 ， 此 时 为 奇异 和 矩阵 
delete is; 
delete js; 
return FALSE; 


J 
if(is[k] != k) // 当 前 行 个 包含 地 大 元 系 
for(j=0;j<nLen;j++) 


l 
/ / 2238418477 R 
p = pDbSrc[k*nLen + 7]; 
pDbSrc[k*nLen + j] = pDbSrc[(is[k]*nLen) + j]; 
pDbSrc[| (is[k])*nLen + j] = p; 


if(js[k] != k) // 当 前 列 不 包含 取 大 元 系 


for(i=0; i<nLen; i++) 


l 
/ / ЖЕРИ 71] лж 
p = pDbSrc[| i*nLen + k]; 
pDbSrc[i*nLen + k] = pDbSrc[i*nLen + (js[k])]; 
pDbSrc[i*nLen + (js[k])] = p; 
J 


pDbSrc[k*nLen + k]=1.0/pDbSrc[k*nLen + k]; // 求 主 
元 的 倒数 


// a[k,j]a[k,k] -> a[k,j] 
for(j=0; j<nLen; j++) 
if(j != k) 


pDbSrc[k*nLen + j]*=pDbSrc[k*nLen + k]; 
} 


// ali,j] - ali,k|]a[k,j] -> а[1,3] 
Ғог(1=0; і<піеп; i++) 
if(i != К) 
Ғог(3=0; ј<піеп; j++) 
if(j!=k) 


l 
pDbSrc[i*nLen + j] -= pDbSrc[|i*nLen + k]*p 
DbSrc[k*nLen + j]; 


// -ali,k|a[k,k] -> а[і, к] 
for(i=0; i<nLen; i++) 


if(i != k) 

l 

pDbSrc[i*nLen + k] *= -pDbSrc[|k*nLen + k]; 
} 


} 
for(k=nLen-1; k>=0; k--) 


l 
// 恢 复 列 
if(js[k] != k) 
for(j=0; j<nLen; j++) 
{ 
р = pDbSrc[k*nLen + j]; 


pDbSrc[k*nLen + j] = pDbSrc[(js[k])*nLen + j]; 
pDbSrc[(js[k])*nLen + j] = p; 


// 恢 复 行 
if(is[k] != k) 
for(i=0; і<піеп; i++) 
l 
p = pDbSrc[|i*nLen + k]; 
pDbSrc[i*nLen + k] = pDbSrc[i*nLen +(is[k])]; 
pDbSrc[i*nLen + (is[k])] = p; 
} 
} 


// 将 结 朱 复制 回 系数 窃 阵 ppDbMat 
nCnt = 0; 
for(i=0; i<m_nBasePt; i++) 
l 
for(j=0; j<m_nBasePt; j++) 
ppDbMat[i][j] = pDbSrc[nCnt++]; 


} 
/ /释放 空间 


delete is; 
delete js; 
delete[ | pDbSrc; 


return TRUE; 


(3) 图 数 ProdMatO 用 于 实现 式 〈4-34) 中 的 
扰 阵 乘法 ， 相 应 代 人 如下。 


kuk S K ыы ET 


void CImgProcess::ProdMat(double** ppDbMat, double *pDb 
Src2, double *pDbDest, int y, int x, int z) 
功能 : 计算 两 矩阵 的 乘积 
注 : 该 丸 数 计算 两 个 滤 阵 的 相 屠 ， 然 后 将 相 乘 的 结 采 存放 在 pD 
bDest 中 。 
其 中 pDbSrc1 * 的 大 小 为 x*z，pDbSrc2 的 大 小 为 z*+y，p 
DbDest 的 大 小 为 x*y 
参数 : double *pDbSrc1: ЕАН ЕАР 
double *pDbSrc2: 指向 相 乘 窍 阵 的 内 存 
double *pDbDest: 存放 矩阵 相 乘 运行 结果 有 的 内 存 指 针 
int х: ЖЕНА У, АЖ: лр Е 
int у: ЖЕРЕХ, HZ J RAZO 
int z: 矩阵 的 尺寸 ， 有 具体 参见 函数 注 
返回 值 : Ж 
клк ЕЕ КЕЕ EEE ERE 
void CImgProcess::ProdMat(double** ppDbMat, double *pDb 
Src2, double *pDbDest, int y, int x, int z) 
{ 
int nCnt = 0; 
int 1,7; 
double * pDbSrc1 = new double[m nBasePt * m nBasePt 


for(i=0; i<m_nBasePt; 1++) 
l 
for(j=0; j<m_nBasePt; j++) 
pDbSrc1[nCnt++] = ppDbMat[i][j]; //ЖТ RE 
Ий АЛЕ: 
} 


/ [XE PEHR 
for(i=0;i<y; i++) 
{ 
for(j=0;j<xXx;j++) 
{ 


pDbDest[i*x + j] = 6; 
for(int m=0;m<z;m++) 
pDbDest[|i*x + j] += pDbSrc1[i*z + m]*pDbSrc2[m 


*x + j]; 
J 
J 
// 将 结束 复制 回 系 数 定 阵 ppDbMat 
nCnt = 0; 
for(i=0; і<т nBasePt; i++) 
l 


for(j=0; j<m_nBasePt; j++) 
ppDbMat[i][j] = pDbSrc1[nCnt++]|; 
J 


delete [ ]pDbSrc1; 


(4) РА ProjTrans OIR i r Pa Z: 27 
pDbProjPara 数 组 对 点 pt 实施 投影 变换 ， 实 现代 码 如 
Pe 
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MYPOINT CImgProcess::ProjTrans(CPoint pt, double* pDbPr 


ojPara) 
功能 : 根据 变换 参数 对 扣 pt 实 施 投 影 变换 
参数 : СРоіп pt: 要 进行 投影 变换 的 点 坐标 


double* pDbProjPara: 变换 参数 
返回 值 : MYPOINT 
ЖОКЕ КЕЛЕЕК ЕЕЕ ЕЕЕ ЕЕЕ 
MYPOINT CImgProcess::ProjTrans(CPoint pt, double* pDbPr 
ojPara) 


MYPOINT retPt; 

retPt.x = pDbProjPara[90] * pt.x + pDbProjPara[l] * 
pt.y + pDbProjPara[2] * pt.x * 
pt.y + pDbProjPara[3]; 

retPt.y = pDbProjPara[4] * pt.x + pDbProjPara[5] * 
pt.y + pDbProjPara[6] * pt.x * pt.y + pDbProjPara[7]; 

return retPt; 


) 





(5) 最 后 ，CImgProcess 类 提供 的 
ImProjRestore 方 法 封 攻 了 上 述 的 投影 变形 校正 过 
程 ， 访 函数 根据 基准 图 像 的 基 人 叭 点 数组 pPointBase 
与 对 应 的 输入 图 像 的 基准 点 数组 bPointSampl 调 用 
GetProjPara 方 法 确定 变换 参数 ， 再 依照 算法 4.2 的 插 
术 ， 扫 拉 图 像 ， 调 用 ProjTrans0) 函 数 实现 对 每 个 点 
的 投影 映射 ， 复 制 对 应 像 系 ， 从 而 得 到 基准 图 像 / 
(хо, уо)- ЖИЧА. 





а наа 


BOOL CImgProcess::ImProjRestore(CImgProcess* pTo, СРоіп 
t *pPointBase, CPoint *pPointSampl, bool bInterp ) 


功能 : 实施 投影 变形 校正 
参数 : CImgProcess* pTo: 校准 后 图 像 的 CImgProcess 指针 


CPoint *pPointBase: 基准 图 像 的 基准 点 数组 

CPoint *pPointSampl: 输入 图 像 的 基准 点 数组 

bool bInterp: 是 人 奋 使 用 ( 双 线 性 ) 插 值 
返回 值 : MYPOINT 


TT 


BOOL CImgProcess::ImProjRestore(CImgProcess* pTo, CPoin 


t *pPointBase, CPoint *pPointSampl, bool bInterp ) 


l 
double* pDbProjPara = new double[m_nBasePt * 2]; 
GetProjPara(pPointBase, pPointSampl, pDbProjPara); 


// 用 得 到 的 变换 系数 对 图 像 实施 变换 
int i, J; 
int nHeight = pTo->GetHeight(); 
int nWidth = pTo->GetWidthPixel(); 
for(i=0; i<nHeight; i++) 
l 

for(j=0; j<nWidth; j++) 


// 对 每 个 点 (Jj，i)， 计 算 其 投影 失真 后 的 点 PtProj 
MYPOINT ptProj = РгојТгапѕ( CPoint(j, i), pDbPro 
jPara ); 


if(bInterp) 


int nGray = InterpBilinear(ptProj.x, ptProj.y) 


// 输 入 图 像 〈 投 影 变 形 图 像 ) 的 对 应 点 灰 
度 
if(nGray >= Ө) 
pTo->SetPixel(j, i, RGB(nGray, nGray, nGray) 
); 
else 
pTo->SetPixel(j, i, RGB(255, 255, 255)); // 
а 108, лн, 
J 


else 


{ 
int ii = ptProj.y + 0.5; // 四 售 五 入 的 最 近邻 插值 
int jj = ptProj.x + 0.5; 


if( ii>@ && ii<GetHeight() && jj>0 && jj<GetWi 
dthPixel() ) 
pTo->SetPixel(j, i, GetPixel(jj, 11)); 
else 
pTo->SetPixel(j, i, RGB(255, 255, 255)); // 
а 08, лн, 
J 


) 


J 
delete pDbProjPara; 
return TRUE; 





4.9.3 ”功能 测试 


本 节 在 视 类 中 编写 了 OnGeomCali() 函 数 用 于 测 
试 系统 的 功能 。 充 图 数 首 移 调 用 一 个 对 话 框 让 用 户 
以 交互 的 方式 放 定 输入 图 像 和 基 惟 图 像 的 基准 点 坐 
怀 ， 对 于 汽车 牌照 的 示例 图 瞩 leftside.bmp， 人 参数 议 
置 如 图 4.22 所 示 。 


以 通过 交互 方式 获得 的 基准 点 对 儿 数 组 
pBasePts() 以 及 pSrcPts() 作 为 参数 ， 调 用 
ImProjRestore() 函 数 即 可 完成 输入 图 像 与 基准 图 像 
之 间 的 配 准 ， 从 而 实现 对 输入 图 像 的 投影 失真 校 
正 。 国 数 的 最 后 一 个 参数 为 0 表示 使 用 最 近邻 插 
伸 ， 为 1 则 使 用 双 线 性 插值 ， 分 别 使 用 这 两 种 插值 
方法 的 处 理 效果 如 图 4.23 (а) . 423 (b) 所 


IRo AAM EI YA HARAS H F o 


= ЖЕР РА ЭЕ БАДА ЯЛЕ — [leftside. bmp] 
WE НЕ) куар) AERO ЕНЧА (Т) HH 2) ПЕЦЕ (Q) НЧА ОМ) AaS ERGa Ehet C) 
EA (ү) gow ЖН) ах 
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Pa [295 [119 риз [310 fioo 
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图 4.22 ”投影 变形 校正 的 参数 设 定 


imglnput.ImProjRestore(&imgOutput, pBasePts, pSrcPts, 1 
); // 使 用 双 线 性 插值 的 投影 校正 
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Са) 最 近邻 插值 的 结果 (b) 双 线 性 插值 的 结果 


44.23 ”投影 变形 校正 后 的 汽车 牌照 图 像 


由 网 4.23 可 见 ， 在 处 理 后 的 网 像 中 车 牧区 域 已 
经 归 一 化 成 了 一 个 标准 矩形 ， 其 中 的 字符 变形 也 得 
到 了 很 好 的 校正 。 


菜单 响应 函数 OnGemoCali0 的 完整 实现 如 下 。 


void CDIPDemoView: : ОпбеотСа11 () 
{ 
// 投影 校正 


// 获取 文档 
CDIPDemoDoc* pDoc = GetDocument( ) ; 


// 输入 对 和 象 


CImgProcess imgInput = pDoc->m Image; 


// ПЕ е и 25J 2K J 4 
if (imgInput.m pBMIH->biBitCount!=8) 
{ 


AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 


return; 


) 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


CPoint pBasePts[4]; // 基 准 图 像 基准 点 数组 
CPoint pSrcPts[4]; // 输 入 图 像 基 准点 数组 


// 创建 对 话 框 
CD1gProjRestore dlgPara; 


// аа А ИЕ ИЕ р 
dlgPara.m xPt1 = 108; 
dlgPara.m yPt1 = 135; 


dlgPara.m xPt2 = 274; 
dlgPara.m _yPt2 = 51; 


dlgPara.m xPt3 = 295; 
dlgPara.m yPt3 = 119; 


dlgPara.m xPt4 = 158; 
dlgPara.m yPt4 = 248; 


// АВАЙ ЕЕ ра 
dlgPara.m_xBPt1 = ө; 
dlgPara.m_yBPt1 


II 
© 
\№ ө 


dlgPara.m xBPt2 = 310; 
dlgPara.m _yBPt2 = ө; 


dlgPara.m xBPt3 = 310; 
dlgPara.m yBPt3 = 100; 


dlgPara.m_xBPt4 = Ө; 
dlgPara.m yBPt4 = 100; 


// 显示 对 话 框 ， 提 示 用 户 设 定 参 数 
if (dlgPara.DoModal() != IDOK) 


// 返回 


return; 


} 


// 获取 用 尸 设 定 的 参数 
pBasePts[8] = CPoint(dlgPara.m xBPt1, dlgPara.m yBP 
t1); 


pBasePts[1] = CPoint(dlgPara.m xBPt2, dlgPara.m yBP 
t2); 

pBasePts[2] = CPoint(dlgPara.m xBPt3, dlgPara.m yBP 
t3); 

pBasePts[3] = CPoint(dlgPara.m xBPt4, dlgPara.m yBP 
t4); 


pSrcPts[@] = CPoint(dlgPara.m xPt1, dlgPara.m yPt1) 


pSrcPts[1] CPoint(dlgPara.m xPt2, dlgPara.m yPt2) 


pSrcPts[2] CPoint(dlgPara.m xPt3, dlgPara.m yPt3) 


pSrcPts[3] = CPoint(dlgPara.m xPt4, dlgPara.m yPt4) 


// 更 改 光 标 形状 


BeginWaitCursor( ) ; 


// 调用 ImProjRestore( ) 函 数 实现 图 像 投 影 校正 
imgInput.ImProjRestore(&imgOutput, pBasePts, pSrcPt 
$, 1); 


// 将 结果 返回 给 文档 类 

pDoc->m Image = imgOutput; 
// 设置 及 标记 
pDoc->SetModifiedFlag(TRUE); 


// ЗВТ 
pDoc->UpdateAllViews(NULL); 


// 恢复 光标 
EndWaitCursor(); 


BA Н] ЕДУ И DIPDemo Н] #1 
令 “ 几 何 变 换 Бл ЕА Z: OnGemoCali() K 
Ж 9 观察 处 理 效 果 9 


HoR ”空间 域 图 像 增 强 


图 像 增 强 是 数字 图 像 处 理 相对 简单 却 最 上 其 艺术 
PER SUR —, RHI H ВЧЕН Rea, з ВИЯВ 
ЖД Y ВАА рУ Pk (ау #& Hh R lH — ja А rH pe r Эҳ 
RIRE. УТЕ АА | f хе оа BRIX ШЛУ, 
使 其 看 起 来 更 加 一 日 了 然 。 应 记 住 ， 增 强 是 图 像 处 
理 中 非常 主观 的 领域 ， 它 以 怎样 构成 好 的 增强 效 来 
这 种 人 的 主观 偏好 为 基础 ， 也 正 古 这 一 后 为 其 赋予 
了 艺术 性 。 这 与 图 像 复 原 技 术 刚 好 相反 ， 图 像 复原 
retail 


本 章 的 知识 和 技术 热点 
(1) а АЈ ЕВЕ НУ НА 
(2) JHI 4 
(3) 图 像 平 滑 ， 包 括 平 均 平 滑 和 高 斯 平滑 
(4) 中 值 滤 波及 其 改进 算法 


(5) РИИ, ЗЛЕ. MEMA 
f. meS IEA -A Н А7 pA 


(1) 对 椒盐 噪声 的 平滑 效果 比较 
(2) Laplacian 与 LoG 算 子 的 锐 化 效果 比较 


51 Ио 
1， 为 什么 要 进行 图 像 增 强 


图 像 增强 是 指 根据 特定 的 第 要 突出 一 幅 图 像 中 
的 人 条 些 信息 ， 同 时 ， 贱 弱 或 去 除 条 些 不 需要 的 信 筷 
的 处 理 方 法 。 其 主要 目的 十 使 处 理 后 的 图 像 对 条 种 
和 翌 定 的 应 用 来 襄 ， 比 原始 图 像 更 适用 。 因 此 ， 这 关 
处 理 是 为 了 人 条 种 应 用 目的 而 去 改善 图 像 质 量 的。 处 
ннан 
系统 。 


应 该 明确 的 是 增 强 处 理 并 不 能 增强 原始 图 像 的 
信息 ， 其 结 示 只 能 增强 对 未 种 信息 的 辨 列 能 力 ， 而 
同时 这 种 处 理 有 可 能 损失 一 些 其 他 信息 。 正 因 如 此 
人 很 难 找到 一 个 评价 图 像 增强 效 末 优 务 的 客观 标 人 准 ， 
也 束 没 有 特 列 通用 模式 化 的 图 像 增 强 方法 ， 忆 十 要 
读 痢 根据 上 其 体 期 户 的 处 理 效 果 做 出 取舍 。 


2. 图 像 增强 的 分 类 


图 像 增强 技术 基本 上 可 分 成 两 大 类 : 一 类 是 空 
间 域 增强 ， 另 一 类 是 频率 域 增强 。 本 章 着 重 介绍 空 
间 域 增强 技术 ， 下 一 章 讲述 频率 域 图 像 增 强 技术 。 


ZE [АЈ Ж ERIH ун БуЛ ЖЕТ ГЄ] {Ж ЛИ И Ду хе РА ЛЖ 
然 不 同 的 图 像 增 强 技 术 ， 实 际 上 在 相当 程度 上 说 它 
们 征 在 不 同 的 领域 做 同 件 的 事情 ， 征 殊途同归 的 ， 
只 和 古 有 些 滤 疲 更 适合 在 空间 莽 宛 成， 而 有 些 则 更 适 
Т ТЕЛИ ҖЕ Н FE o 


空间 域 图 像 增 强 技 术 主 要 包括 直方 图 修正 、 灰 
皮 变 换 增 强 、 图 像 平 滑 化 以 及 图 像 锐 化 等 。 在 增强 
过 程 中 可 以 采用 单一 方法 处 理 ， 但 更 多 实际 情况 是 
需要 采用 几 种 方法 联合 处 理 ， 才 能 达到 预期 的 增强 
效果 《水 远 不 要 指望 菏 个 蛙 一 有 的 图 像 处 理 方法 可 以 
解雇 全 部 问题 ) 。 


在 第 3 章 中 通过 灰 度 变换 改善 图 像 外 观 的 方 
法 ， 以 及 3.7 和 下、3.8 中 的 直方 图 次 度 修正 技术 
( 即 下 方 图 均衡 化 和 和 直方 图 规定 化 〉 部 十 图 像 增强 
的 有 效 手段 ， 这 些 方法 的 共同 点 征 变 换 是 百 接 针 对 
像 系 灰 度 全 鸭 ， 与 议 像 系 所 处 的 邻 城 无 大， 而 空间 
域 增 强 则 十 验 于 岁 像 中 每 一 个 小 范围 《〈《 邻 域 ) 内 的 
BREIT KERMES, AARRE a HIKE H 
IZARREN AARE a ХРЕН R RE, AE 
闻 域 增强 也 称 为 邻 域 运算 或 邻 域 滤波 。 衬 间 域 变换 


Н 


可 使 用 下 却 拍 述 : 
g(x,y)=TI|f(x,y)] 


(5-1) 


52 TJERE 


滤波 是 信号 处 理 中 的 一 个 概念 ， 是 将 信号 中 特 
定 波段 频率 滤 除 的 操作 ， 在 数字 信号 处 理 中 通常 通 
过 传 里 时 变换 及 其 递 变换 实现 。 由 于 下 面 要 学 习 的 
内 容 实际 上 和 通过 传 里 叶 变换 实现 的 频 域 下 的 滤波 
是 等 效 的 ， 故 而 也 称 为 小波。 空间 域 滤波 主要 直接 
基于 邻 域 (空间 域 ) 对 图 像 中 像素 执行 计算 ， 本 章 
使 用 空间 域 滤波 这 一 术语 区 别 于 第 6 章 中 将 要 讨论 
的 频率 域 滤 波 。 


1. 空间 域 滤波 和 邻 域 处 理 
ХЕИ ННВ (х, у), ER РЕНЕ. 


(1) 对 预 完 定义 的 以 《x ，y ) 为 中 心 的 邻 域 
内 的 像 系 进行 运算 。 


(2) 将 (1) 中 运算 的 结 来 作为 (x，y) А 
БТ HJ] ДУ. o 


上 述 过 程 就 称 为 邻 域 处 理 或 空间 域 滤 波 。 一 幅 
Ч РАИ РОР Ер Кр (х, у)» fixy З 
面 表明 了 空间 位 置信 息 ， 称 为 空间 域 ， 基 于 x -y T 
EJ SREL RIVE YX EENE IYNE T RIEN. WRIT FERE 
中 的 像素 计算 为 线性 运算 ， 则 又 称 为 线性 空间 域 滤 
波 ， 人 盏 则 称 为 非 线 性 空间 域 滤 波 。 


图 5.1 下 观 地 展示 了 用 一 个 3x3 的 模板 С :为 
ИЕК, ЛИЛИ. Мы, МАА) 34218] 
НЕ, хм, Н a ЖЕН Т» 


ҮБӘ Е Н (х, y ) HA FA li 5) 
板 ， 使 模板 中 心 和 点 (x ，y ) 曾 合 。 在 每 一 点 (x，y 
处 ， 滤 波 右 在 该 点 的 啊 应 是 根据 模板 的 其 体内 容 
并 通过 预 乞 定义 的 关系 来 计算 。 一 般 来 说 模板 中 的 
韭 0 元 又 指 出 了 邻 域 处 理 的 沁 围 ， 只 有 那些 当 模 板 
中 心 与 点 x, y) ЖЕН, Kaf 中 和 模板 中 非 0 
ВАВ) REA (х, у) BREN 
操作 。 在 线性 空间 滤波 中 模板 的 系数 则 给 出 了 一 种 
加 权 模 式 ， 即 (x, y) 处 的 啊 应 由 模板 系数 与 模 
板 下 面 区 域 的 相应 F 的 像 系 值 的 乘积 之 和 给 出 。 例 
如 ， 对 于 图 5.1 而 言 ， 此 刻 对 于 模板 的 啊 应 R 为 : 


R = w (-1, -1) f (x -1, y -1) + w (-1, 0) f (x -1,y ) + 
-+w (0, 0) (х,у) +...+ м (1, 0) (х +1, у) + м (1, 
Df (x +1, у +1) 


更 一 般 的 情况 ， 对 于 一 个 大 小 为 m xn WJ: 
板 ， 其 中 m= 2a +1, n=2b+1, a, bið KE 
数 ， 即 模板 长 与 览 均 为 基数 ， 有 日 可 能 的 最 小 尺寸 为 
3x3〔 侦 数 尺寸 的 檬 板 由 于 其 不 具有 对 称 性 因而 很 
少 被 使用， 而 1x1 大 小 的 模板 的 控 作 不 考虑 邻 域 信 
Ы, ЖИВ ЈА) ， 可 以 将 滤波 操作 形式 化 
地 表示 为 : 


gir, y) = )3 > u[s.t)flz + =, + t) 
(5-2) 
对 于 大 小 为 MxN 的 图 像 F0,...， М -1,0,..., N 
-1), Xfx = 0,1,2, ..., М -1 和 y = 0,1,2,..., N -1 依次 应 


用 公式 ， 从 而 完成 了 对 于 图 像 f 所 有 像 系 的 处 理 ， 
得 到 新 的 图 像 g 。 


Му чыры 





图 像 f (х,у) 


此 时 模板 下 的 图 像 灰 度 


图 5.1 ”空间 滤波 示意 


2. 边界 处 理 


执行 滤波 操作 要 注意 的 一 点 是 当 模 板 位 于 图 像 
边缘 时 ， 会 产生 模板 的 某 些 元 素 很 可 能 会 位 于 图 像 
之 外 的 情况 ， 这 时 ， 对 于 在 边缘 附近 执行 滤 流 操作 
需要 单独 处 理 ， 以 避免 引用 到 本 不 属于 图 像 的 无 意 
义 的 值 (在 MATLAB 中 这 将 引起 系统 的 警告 ， 而 在 
VC 中 很 可 能 会 由 于 非法 访问 内 存 而 产生 运行 错 
s 


Р ТЗТ RARE] РДН Ж OL УК [Ө] o 


(1) 收缩 处 理 范 围 一 一 处 理 时 忽略 位 于 网 像 / 
边 者 附近 会 引起 问题 的 那些 点 ， 如 对 于 图 5.1 中 所 使 
HRR, AEN A ERF A ALNA E 
边界 ， 即 只 处 理 从 x = 1,2,3,..., M -2 和 y= 1,2,3,... N 
-2 (在 MATLAB 中 应 为 x = 2,3,4,..., M -1 和 y = 2,3,4, 
г. N-1) 范围 内 的 点 ， 从 而 确信 了 滤波 过 程 中 模板 
I уси И В 7. 


(2) BEH E 20 A РЧ — K Pu Es: АА у 
ЧК Bedi ЭТ, ЕЗД К Za [ËL УЗН AE Н 
数 ， 如 0， 得 到 虚拟 图 像 f?， 你 证 模板 在 移动 过 程 
中 始终 不 会 超出 户 的 边界 。 


(3) 使 用 复制 像 妹 的 方法 项 苑 图像 一 一 和 


(2) 基本 相同 ， 只 征用 来 填充 虚拟 边界 像 系 什 的 
шашынын Пл RARA RAIAR 
工 No 


这 些 拉 巧 在 本 草 后 面 的 小 市 程序 设计 实例 中 将 
给 出 上 其 体 实现 。 


3. ERMER 


除了 5.4.1 小 市 给 出 的 滤波 过 程 外 还 有 一 种 称 为 
关 积 的 滤波 过 程 。5.4.1 小 蔬 中 给 出 的 滤波 公 云 实际 
上 是 一 种 相关 ， 而 车 积 的 形式 化 表示 上 略 有 不 同 ， 表 
示 如 下 。 


dz, Yy) = У У ш(—5, Ё) fir +s. y + t) 
я=—0 = —ф 
(5-3) 


Ja: BAKEAN, Е KE ZE 
相对 其 中 心 点 做 镜像 后 再 对 f 位 于 模板 下 的 子 图 像 
做 加 权 和 的 ， 或 者 说 在 做 加 权 和 之 前 模板 先 要 以 其 
中 心 点 为 原点 旋转 180*。 如 果 和 忽略 了 这 一 细微 差别 
将 导致 完全 错误 的 结果 ， 只 有 当 模 板 本 里 是 关于 中 
心 点 对 称 时 ， 相 关 和 卷 积 的 结果 才 会 相同 。 


4. 滤波 操作 的 MATLAB 实 现 


MATLAB 中 与 滤波 相关 的 函数 主要 有 imfilter() 
和 fspecial0。ImfilterO 完 成 滤波 操作 ， 而 fspecialO 可 
以 为 使 用 者 创建 一 些 预 定义 的 二 维 滤波 苍 ， 百 接 供 
imfilter() K žE H - 


(1) 滤波 函数 imfilter0 的 原型 如 下 。 


g = imfilter(f,w,optionl,option2,...) 


参数 说 明 : 


o f EREET IEX ERNE HI BMZ ; 

° шаш ы 的 模板 ， 为 一 个 二 维 数 
zH; 

e option1, option2, ... 是 可 和 选项， 有 基体 可 以 包括 以 
下 内 容 。 


O 边界 选项 : 主要 针对 本 小 节 标 题 2 提 到 的 边 
TAREE |а] 7, 15.1077. 


245.1 ХТД РГА НУ X CK 





Е ПАИ рних 填充 虚拟 边界 ， 默 认 情 况 是 用 0 填充 











'symmetric' HEIA] РУ A E ХУ EA А РЕОНИ АНУ R B 
像 边缘 做 镜像 而 得 到 











'replicate' 填充 虚拟 边界 的 内 容 总 是 重复 与 它 最 近 的 边缘 像素 





о G у E te a 


采用 第 一 种 方式 固定 值 填充 虚拟 边界 的 问题 是 
在 边缘 附近 会 产生 梯度 ， 采 用 后 面 3 种 方式 填充 可 
让 边缘 显得 平滑 。 





尺寸 选项 нЕ ЧН S TUA, ШЖ 
HEME R Ag 的 大 小 ， 如 表 5.2 所 示 。 


表 5.2 尺寸 选项 的 合法 值 的 舍 义 


输出 图 像 g 与 输入 图 像 f 尺 寸 相 同 





输出 图 像 g 的 尺寸 为 填充 虚拟 边 夫 后 的 图 像 有 ?的 尺寸 ， 因 而 大 于 输入 图 像 f 的 尺寸 


(3) 模式 选项 : 指明 滤波 过 程 是 相关 还 是 着 积 ， 
如 表 5.3 所 示 。 


表 5.3 模式 选项 的 合法 值 的 合 义 


IN 
< 


'corr' 滤波 过 程 为 相关 





返回 值 : 
。g 为 滤波 后 的 输出 图 像 。 
【 例 5.1】 谈 入 灰 度 图 像 f = cameraman.tif, H 


111\ 
模板 ” | 1! | 对 f 进行 相关 滤波 ， 采 用 重复 的 边 
界 填充 方式 。 相 关 代 码 如 下 。 


>> f = imread('cameraman.tif'); % 读 入 网 像 
>> imshow(f); % 得 到 图 5.2 (а) 的 图 像 
>> w = [1 1 1; 1 1 1; 111] / 9 XEWKIN 


0.1111 0.1111 0.1111 
0.1111 0.1111 0.1111 
0.1111 0.1111 0.1111 


>> р = imfilter(f, w, 'согг', 'replicate'); % 滤 波 
>> figure, imshow(g); % 得 到 5.2 (b) 的 图 像 





运行 结果 如 图 5.2 所 示 。 





(b) В (а) 经 滤波 后 
45.2 ”相关 滤波 前 后 对 比 


(2) 可 创建 预定 义 的 三 维 滤波 妖 有 的 fspecial0 
PA ЖИ НУ» АЛИ ИЖ А ИП F o 


h = fspecial(type,parameters) 


参数 说 明 : 


° 参数 type 指定 了 滤波 占 的 类 型 ， 其 中 一 些 类 型 
的 滤波 器 将 在 5.3 节 和 5.4 节 中 介绍 ， 有 些 则 将 放 
PRBLEEM, ТЕУЛЖ. 
F. type 的 一 些 合法 值 如 表 5.4 所 示 。 


25.4 ”type 闭 合法 取 值 表 


合法 取 值 功能 描述 


圆 形 邻 域 的 平均 模板 


laplacian' 拉 普 拉 斯 模板 
高 斯 - 拉 普 拉 斯 模板 


'prewitt' Prewitt K `F Zhu M r -f- 


。 173754) Лрагатеѓегѕ #17215 хе АЧЕХ 2210 
type 相 天 的 配置 参数 ， 如 尺寸 和 标准 差 等 ， 如 
朱 不 提供 则 函数 使 用 访 关 型 的 默认 参数 配置 | 


返回 值 : 
返回 值 h уе ВЕ С а 
PAAS A КЛИКА ТЕНТА ТЛ АИ НН o 


(1) h = fspecial С ка; hsize) , REAR 
小 为 hsize ВУЗЕ) UE UX йт 2 сј 以 征 一 





ЛЕА Нај, Hh 的 行 和 列 的 数目 ; 
也 可 以 仅 为 一 个 正 整 数 ， 此 时 对 应 于 模板 为 方 阵 的 
情况 。hsize 的 默认 值 为 [3 3]。 


(2) h = fspecial ('disk',radius) ， 返 回 一 个 半 和 从 
为 radius 的 圆 形 平均 模板 ，h 是 一 个 (2radius +1)х( 
2radius +1) 的 方 隆 。 半 人 径 radius 的 默认 值 为 5。 


(3) h = fspecial ('gaussian',hsize,sigma) , 3% JE] 
一 个 大 小 为 hsize ， 标 准 乔 a =sigma HI mi ТИКЕ р 
器 。hsize 的 默认 值 为 [3 3]，sigma 的 默认 值 为 0.5。 


(4) h = fspecial ('sobel') ， 返 回 一 个 加 强 水 平 
12% ВАЛ EL o 


⁄1 2 L 
= | їй 0 о 
EN 


如 果 需 要 检测 竖 直 边 绿 ， 则 使 用 h’。 
5. YEW PENE AJ Visual C++ 实现 


下 面 为 CImgProcess 类 添加 用 于 线性 滤波 的 模 
МЕГЕ, Р Тетрјаіе() 211 -ЃМАТІАВ É] 
imfilter0 HYE, ЕМЕ КАИ (nTempH 
ре" ) ， 并 且 提 供 了 更 大 的 模板 设 定 的 目 由 


栋 板 的 中 心 可 以 由 参数 int nTempMX Mint 
nTempMY 任意 指定 。 参 数 FLOAT xpfArray 为 指 问 
模板 数组 的 指针 ， 而 参数 FLOAT fCoef 为 模板 的 系 
数 ， 即 例 5.1 中 的 19。 尽 管 模板 本 号 是 一 个 二 维 数 
组 ， 但 在 程序 实现 中 使 用 者 将 它 按 行 存储 作为 一 个 
一 维 数 组 对 每 ， 引 用 起 来 同样 非常 方便 ， 如 pfArray 
[k xnTempW + 1 ] 表 示 模 板 第 k 行 的 第 1 个 元 系 。 


Template() 函 数 中 在 一 开始 就 将 目标 图 像 初 始 
化 为 黑色 ， 并 有 日 没有 填充 图 像 边 界 ， 采 用 的 是 标题 
2 中 提 到 的 第 1 种 收缩 边界 的 委 略 。 因 此 ， 经 过 函数 
Template() 滤 波 的 输出 图 像 的 周围 都 有 很 细 的 一 立 
ЕЕ 对 于 3x3 的 模板 ， 黑 边 的 宽度 为 1。 相 关 的 代 
hyull e 


OS tua i БЕЕК 


void CImgProcess::Template(CImgProcess *pTo, 
int nTempH, int nTempM, 
int nTempMY, int nTempMX, FLOAT *pfArray, F 
LOAT fCoef) 
功能 : ”模板 操作 
注 : 该 函数 用 指定 的 模板 《任意 大 小 ) 来 对 图 像 进行 操作 ， 参 数 


iTempH 指 定 模板 的 高 度 ， 参 数 iTempW 指定 模板 的 宽度 ， 参 数 1i 
TempMX 和 iTempMY 指 定 模 板 的 中 心 元 素 坐 标 ， 参 数 pfArray 指 定 模板 
元 素 ，fCoef 指 定 系 数 。 


参数 : СІтеРгосеѕѕ* pTo: 输出 图 像 的 CImgProcess 指针 
int nTempH: 模板 的 高 上 度 
int nTempW: 模板 的 宽度 
int nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( <= iTempH - 1) 
int nTempMX: 模板 的 中 心 元 素 X 坐 标 ( <= iTempW - 1) 


FLOAT * pfArray: 指向 模板 数组 的 指针 
FLOAT fCoef: 模板 系数 
BRE: Ж 
ed Е / 
void CImgProcess::Template(CImgProcess *рто, 
int nTempH, int nTempM, 
int nTempMY, int nTempMX, FLOAT *pfArray, F 
LOAT fCoef) 


l 
pTo->InitPixels(0); // 目 标 图 像 初 始 化 


int i, j; // 循 环 变 量 


// 扫 插图 像 进行 模板 操作 
for(i=nTempMY; i<GetHeight() - (nTempH - nTempMY) + 1 
; i++) 
l 
for(j=nTempMX; j<GetWidthPixel() - (nTempW - nTempM 
X) + 1; j++) 


l 
// (31,1)5 OA 
float fResult = 0; 
for(int К=0; k<nTempH; k++) 


for(int 1=0; 1<пТетри; 1++) 


l 
// 计 算 加 权 和 
fResult += GetGray(j + 1 - nTempMX, і + k - nTem 
pMY) * pfArray[k * nTempW + 1]; 
J 
J 


// ЗЕР 
fResult *= fCoef; 


// ЖЕ 


fResult = (FLOAT)fabs(fResult); // 锐 化 时 有 可 能 出 现 


FAE 
BYTE byte; 
if(fResult > 255) 
byte = 255; 
else 
byte = fResult + 0.5; // 四 舍 五 入 
pTo->SetPixel(j, i, RGB(byte, byte, byte)); 
}//for j 
}//for i 
J 


为 方便 处 理 ， 在 文件 ImgProcess.cpp 中 作者 已 
经 为 读者 预定 义 了 一 些 常用 的 模板 数组 ， 需 要 时 可 
以 直接 使 用 ， 无 需 再 目 行 设 置 。 相 天 代 合 如 下 。 


// 钊 用 模板 数组 
// 钊 用 模板 数组 


// 平均 平滑 1/9 

float Template Smooth Avg|[|9]=(1, 1, 1, 
1, 1, 1, 

Ta ly |; 

// Gauss`Fi#ë 1/16 

float Template Smooth Gauss[9|={1, 2, 1, 
2, 4, 2, 

а 2a Li 

// Sobel% FL ЖЖ 

float Template HSobel[9]={-1, ©, 1, 


= 25 ð, 2, 
ad ‚Ө 》 1}; 


// Sobe1 水 平 边缘 检测 

float Template VSobel[9|={-1, -2, -1, 
о, ©, ө, 

1, 2, 1}; 


// L0G 边缘 检测 

float Template Log|[25]=í(0, ө, -1, ө, ө, 
Ө, -1, -2, -1, Ө, 

-1, -2, 16, -2, -1, 

0, -1, -2, -1, Ө, 

е, е, =; 0, 0}; 

// Laplacian 边 缘 检 测 

float Template Laplacian1[9] = {0, -1, е, 


+; 4, 1; 
0, -1, Ө 
J; 


float Template Laplacian2[9] = {-1, -1, -1, 
-1, 8, =з 
= = 15 “lp; 


53 图像 平 请 

图 像 平滑 是 一 种 可 以 减少 和 抑制 图 像 噪声 的 实 
用 数字 图 像 处 理 技术 。 在 空间 域 中 一 般 可 以 采用 和 邻 
域 平均 来 达到 平滑 的 目的 。 


5.3.1 平均 模板 及 其 实现 


从 图 5.2 所 示 滤 流 前 后 效果 对 比 可 以 看 出 滤波 后 
的 图 g 有 平滑 或 者 说 模糊 的 效果 ， 这 完全 是 模板 w 
作用 的 结果 。 例 5.1 中 的 w 提供 了 一 种 平均 的 加 权 模 
式 ， 首 先 在 以 点 (x, у) 为 中 心 3x3 邻 域内 的 点 都 
参与 了 决定 在 新 图 像 g P (x, y) 点 像素 值 的 运 
算 ; 而 且 所 有 系数 都 为 1 表示 它们 在 参与 决定 g (x 
‚ у) 值 的 过 程 中 页 献 OE) 都 相同 ;最 后 前 面 
的 系数 是 要 保证 整个 模板 元 系 和 为 1， 这 里 应 为 
1/9， 这 样 就 能 让 新 图 像 同 原始 图 像 保 持 在 一 个 灰 度 
范围 中 〈 如 [0，255]) 。 这 样 的 w 叫 作 平均 模板 ， 
是 用 于 图 像 平滑 的 模板 中 的 一 种 ， 相 当 于 一 种 局 部 
平均 。 更 一 般 的 平均 模板 为 : 


四 1 ££ !\ 
а Д 


| | 
Ш = ——— 
(2k+1) |. 
L l %e Ӯ. (2k+1)x(2k+1) 


1. 工作 原理 


一 般 来 说 ， 图 像 具 有 局 部 连续 性 质 ， 即 相 邻 像 
系 的 数 信 相近 ， 而 噪声 的 存在 使 得 在 噪声 点 处 产生 
灰 度 跳跃 ， 但 一 般 可 以 合理 地 假设 偶尔 出 现 的 噪声 
影 啊 并 没有 改变 图 像 局 部 连续 的 性 质 ， 例 如 下 面 的 


(5-4) 


HARA sub, KERARI IRER. ERSA 


H ЖЕРИ E 1х P ЈАЧИ A o 


f sub= 
200 215 212 208 196 
198 5 202 199 221 
199 207 202 201 211 
203 218 210 210 198 
203 218 210 0 198 
200 215 212 208 205 


对 f HILI PIRR EIT PE EX Ла, IFE 
PYF Ja 镜像 为 g_sub。 


g_sub = 


181 184 166 206 205 


180 182 183 206 207 


181 183 184 206 208 


206 208 186 182 181 
207 210 189 183 180 
206 209 189 184 181 


显然 ， 通 过 平滑 滤波 ， 原 局 部 图 像 人 sub 中 噪声 
点 的 灰 度 值得 到 了 有 效 修正 ， 像 这 样 将 每 一 个 点 用 
周围 点 的 平均 替代 ， 从 而 达到 减少 噪声 影响 的 过 程 
就 称 为 平滑 或 模糊 ç 


2. MATLAB 实 现 


利用 imfilter0 和 fspecial0， 并 以 不 同 尺 二 的 平 
均 模 板 实现 平均 平滑 的 MATLAB 示 例 代 码 如 下 。 


I = imread('baby_noise.bmp'); 

>> figure, imshow(I) % 得 到 图 5.3 (а) "ЈЕ 

>> h = fspecial('average', 3); % 3*3 平 均 模 板 

>> ІЗ = imfilter(I, h, 'corr', 'replicate'); % 相关 滤波 
‚ ERETI 

>> figure, ітѕһом(13) % 得 到 图 5.3 (b) 中 的 图 像 

>> h = fspecial('average', 5) % 5*5 平 均 模 板 


h = 


0.0400 0.0400 0.0400 0.0400 0.0400 
0.0400 0.0400 0.0400 0.0400 0.0400 
0.0400 0.0400 0.0400 0.0400 0.0400 
0.0400 0.0400 0.0400 0.0400 0.0400 


0.0400 0.0400 0.0400 0.0400 0.0400 


>> 15 = imfilter(I, h, 'corr', 'replicate'); 
>> figure, imshow(I5) % 得 到 图 5.3〈c) 中 的 图 像 
>> h = fspecial('average', 7); % 7*7 平 均 模 板 
>> 17 = imfilter(I, h, 'corr', 'replicate'); 
>> figure, ітѕһом(17) % 得 到 图 5.3 (а) 中 的 图 像 





上 述 程序 的 运行 效果 如 图 5.3 所 示 。 从 图 中 可 以 
看 出 随 着 模板 的 增 大 ， 滤 波 过 程 在 平 消 挥 更 多 的 吗 
丽 的 同时 也 使 得 图 像 变 得 越 来 越 模糊 ， 这 是 由 平均 
模板 的 工作 机 理 所 决 定 的 。 当 模板 增 大 到 7x7 时 ， 
图 像 中 的 菜 些 细节 ， 如 衣服 上 的 袜 皱 已 经 难以 辨识 
了 ， 纽 扣 也 变 得 相当 模糊 。 实 际 上 ， 当 图 像 细 节 与 
滤波 和 需 模 板 大 小 相近 时 吏 会 党 到 比较 大 的 影响 ， 克 
其 当 它 们 的 灰 度 值 又 比较 接近 时 ， 寓 合 效 应 导致 的 
图 像 模糊 会 更 明显 。 随 看 模板 的 进一步 增 大 ， 像 纽 
ТПО НУН Ао NER ра ЗР o ГАК, Ег 
TEMA ЛЕ k Л T ET 6 S Е КЛЕН ла J K 
小 ， 有 针对 性 地 进行 滤波 。 


3. Visual C++ 实现 
利用 预定 义 的 平均 模板 Template Smooth_Avg 


和 滤波 图 数 Template() 可 以 方便 地 实现 3x3 的 平均 平 
清 ， 代 码 如 下 上 所 示 。 


// 3*3 平 均 平滑 
imglnput.Template(&imgOutput, 3, 3, 1, 1, Template Smoo 


th Avg, (float)1/9); 





ER, RIK, 02073, МХА) (х,у) 
坐标 为 〈1, 1) 。 预 定义 模板 Template_Smooth_Avg 
的 系数 取 1/9。 


5.3.2 Н SKEN 
1. 理论 基础 


平均 平 请 对 于 邻 域内 的 像 系 一 视 同 仁 ， 为 了 减 
少 平 请 处 理 中 的 和 模糊， 得 到 更 目 然 的 平 请 效 末 ， 很 
有 然 地 想到 适当 加 大 模板 中 心 点 的 权 香 ， 随 看 距离 
中 心 后 的 距离 增 大 ， 权 香 迅 速 减 小 ， 从 而 可 以 确 你 
中 心 后 看 起 来 更 接近 于 与 它 距离 更 近 的 后， 其 于 这 
样 的 考 碟 得 到 的 模板 即 为 高 期 模板 。 





Л á ` = 
(а) 受 噪 声 污染 的 婴儿 老 照片 baby_noise bmp 





| (c) 图 (а) 经 x5 的 平均 模板 洪波 (d) 图 (a) STIRPE 
图 5.3 ”不同 六 小 的 平均 个 板 的 平 请 效果 
利用 的 3x3 的 局 斯 模板 如 下 所 示 。 


1 2 1 
ш=1/16х|2 4 2 
1 2 1J 


高 斯 模板 名 字 的 由 来 是 二 维 高 斯 函数 ， 即 读者 
КАЈ ЕА ра, Р, К, А) 
值 为 0、 方 差 为 o“ 的 二 维 高 斯 函数 如 下 。 其 3 维 示意 
图 ， 如 图 5.4 所 示 。 


(5-5) 


"i г) J ч 
(т^ +), 


EXD | == WaE” U SSE | 
zU 





LT., yY] = m, 
And 


(5-6) 


局 斯 模板 正 古 将 连续 的 二 维 高 斯 函数 的 离 黎 化 
表示 ， 因 此 任意 大 小 的 高 斯 模板 都 可 以 通过 建立 一 
个 (2Kk+1) x (2k+1) 的 矩阵 MM 得 到 ， 其 Gi, j 
) 位 置 的 元 系 值 可 如 下 确定 : 


(i—k—1)2 6 (j – 6 1)2). 
| )), 


пе l | 
М2, 91 = ехр— Iy? 


i г} 
Ana” 





(5-7) 


г 9093 J ye 5 


МИЕ Ж о 取 不 同 的 值 时 ， 二 维 
融 斯 函数 的 形状 会 有 很 六 的 变化 ， 
而 在 实际 应 用 中 选择 合适 的 o 值 非常 
重要 : Жо 过 小 ， 偶 离 中 心 的 所 有 
像 系 权重 将 会 非 钊 小 ， 相 当 于 加 权 和 
呆 应 基本 不 考虑 邻 域 像 系 的 作用 ， 这 
样 滤波 操作 退化 为 图 像 的 点 运算 ， 无 
法 起 到 平 清 噪 声 的 作用 ;相反 如 条 
过 大 ， 而 邻 域 相对 较 小 ， 这 样 在 邻 域 
内 高 斯 模板 将 退化 为 平均 模板 : 只 有 
`o 取 合 适 的 值 时 才能 得 到 一 个 像 系 
值 的 较 好 估计 。MATLAB 中 c 的 默认 
值 为 0.5， 在 实际 应 用 中 ， 通 第 对 3x3 
的 模板 取 o 为 0.8 左 右 ， 对 于 更 大 的 模 
板 可 以 适当 增 大 o 的 值 。 


M 





图 5.4 ”二 维 高 斯 函数 ?= Z= l 222) Ну =1 时 的 3 维 示意 
2. MATLAB 实 现 


采用 不 同 的 o 实现 高 斯 平 请 的 MATLAB 代 但 如 
Fo 





>> I = imread('baby_noise.bmp'); 
>> figure, imshow(I); % 得 到 多 5.5 (а) 中 的 图 像 


>> h3 5 = fspecial('gaussian', 3, 0.5); % sigma=6.5 的 3x 


>> ІЗ 5 = imfilter(I，h3 5); % 高 斯 平滑 


>> figure, ітѕһом(13 5); % 得 到 图 5.5 (b) 中 的 图 像 

>> 

>> h3 8 = fspecial('gaussian', 3, 0.8); % sigma=6.8 的 3x 
3 局 斯 模板 

>> I3 8 = imfilter(I, h3 8); 

>> figure, imshow(I3_8); % 得 到 图 5.5〈c) 中 的 图 像 

>> 

>> h3 18 = fspecial('gaussian', 3, 1.8) % sigma=1.8 的 3x 
3 局 斯 模板 ， 接 近 于 平均 模板 


h3 18 = 


0.0997 0.1163 0.0997 
0.1163 0.1358 0.1163 
0.0997 0.1163 0.0997 


>> ІЗ 18 = imfilter(I, h3 18); 

>> figure, imshow(I3 18); {25.5 (а) 中 的 网 像 
>> 

>> h5 8 = Ғѕресіа1('баиѕѕіап', 5, 0.8); 

>> I5 8 = imfilter(I, h5 8); 

>> figure, imshow(I5_8); 92] 5.5 (е) 中 的 图 像 

>> imwrite(I5 8, 'baby5 8.bmp'); 

>> 

>> I7 12 = imfilter(I, h7 12); 

>> figure, imshow(I7 12); %#*U|É5.5 (f) 中 的 网 像 
>> imwrite(I7 12, 'baby7_12.bmp'); 


上 述 程序 的 运行 结果 如 图 5.5 所 示 。 图 5.5 (b) 
中 所 示 的 图 像 由 于 o 偏 小 而 平滑 效果 不 明显 ; o 
增 大 至 1.8 时 ， 图 5.5 (d) 中 所 示 的 高 斯 平滑 效果 类 
似 于 图 5.4 (b〉 的 平均 平 消 效果 。 随 肴 模板 的 增 


K, А р): 48 21 / НЕШ, БК 9 
5.5 (f) ЖШ 5.4 (а) "РАЈЕ, EAR 
到 同样 在 大 小 为 7x7 的 情况 下 ， 融 斯 滤波 后 的 图 像 
中 国 像 细 币 极 较 好 地 保留 。 


上 面 介绍 的 平均 平滑 滤波 器 和 高 斯 平滑 滤波 器 
都 是 线性 平滑 滤波 器 ， 在 学 习 频 率 域 滤波 之 后 ， 还 
可 以 为 它们 赋予 另外 一 个 名 字 一 一 低 通 滤波 器 ， 
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Б. ег z: 1 J е 
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5.5 不同 大 小 的 高 斯 模板 的 平 请 效果 
3. Visual C++ 实现 
利用 预定 义 的 高 斯 模板 


Template _Smooth_Gauss FUYE YX 2 22 Template( ) 可 以 
A EHSA е ЗР, ARABA Кт o 


// 3*3 mH PA 
imgInput.Template(&imgOutput, 3, 3, 1, 1, Template Smoo 


th_Gaussian, (float)1/16); 





栋 板 长 、 筑 均 为 3， 柑 板 中 心 的 (x , y ) 坐 标 为 (1， 
1 )。 预 定义 模板 Template_Smooth_Gaussian 的 系数 
取 1/16。 


5.3.3 ”通用 平 清 滤波 的 Visual C++ 实现 


可 以 采用 用 户 目 定义 的 模板 作为 参数 调用 滤波 
图 数 Template0， 实 现 一 个 通用 的 儿 像 平 请 函数 
OnEnhaSmooth()。 访 函数 文 持 尺 寸 小 于 等 于 5 的 任 
意 模板 ， 从 而 可 以 方便 地 实现 平均 平滑 、 高 斯 平滑 
和 其 他 一 些 自 定义 的 平 消 。 


国 数 OnEnhaSmoothO 的 实现 如 下 。 


void CDIPDemoView: :OnEnhaSmooth() 
{ // 图 像 平 请 


// 获取 文档 
CDIPDemoDoc* pDoc = GetDocument( ) ; 
// 输入 对 象 


CImgProcess ImgInput = pDoc->m Image; 


// 检查 图 像 症 灰 度 图 

if (imgInput.m pBMIH->biBitCount!=8) 

{ 
AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 
return; 


} 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


int nTempH; // 模板 高 度 
int nTempW; // 模板 宽度 
FLOAT fTempC;// 模板 系数 
int nTempMX;// Tir P >л 8 XA ER 
int nTempMY;// 模板 中 心 元 系 Y 坐 标 


// 模板 元 素数 组 赋 初 值 ( 默 认为 3x3 平 均 模 板 ) 
FLOAT aValue[25] = {1.0, 1.0, 1.0, 0.0, 0.0, 


1.9, 1.9, 1.9, 09.0, 09.0, 
1:0; 1:0; 1:0; 0:0; 0:0, 
0.0, 0.0, 9.0, 0.0, 0.0, 
о.ө, 0.0, 90.9, 0.0, 0Ө.0,}; 


// 创建 对 话 框 
CDlgSmooth dlgPara; 


// 初始 化 对 话 框 变量 信 


dlgPara.m IntType = 
dlgPara.m iTempH = 
dlgPara.m iTempW = 
dlgPara.m ITempMX = 1; 
dlgPara.m ITempMY = 1; 


чө ө 
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dlgPara.m fTempC = (FLOAT) (1.0 / 9.0); 


dlgPara.m fpArray = aValue; 


// 显示 对 话 框 ， 提 示 用 户 设 定 参 数 
if (dlgPara.DoModal() != IDOK) 


// 返回 


return; 


) 


// ЗКЕН Р OE RZ 23 

nTempH = dlgPara.m iTempH; 
nTempW dlgPara.m_iTempW; 
nTempMX = dlgPara.m iTempMX; 
nTempMY = dlgPara.m iTempMY; 
flempC = dlgPara.m fTempC; 


// 更 改 光 标 形状 


BeginWaitCursor( ) ; 


// 调用 Template() 函 数 实现 平滑 滤波 


imgInput.Template(&imgOutput, nTempH, 


nTempMX, aValue, fTempC); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 设置 脏 标 记 
pDoc->SetModifiedFlag(TRUE); 


niempW, nTiempMY 


// 更 新 视图 
pDoc->UpdateAllViews(NULL); 
// 恢复 光标 
EndWaitCursor(); 

J 





国 数 OnEnhaSmoothO 运 行 时 会 弹出 对 话 框 ， 要 
求 用 户 设 置 模板 。 读 者 可 以 通过 光盘 中 示例 程序 
DIPDemo 中 的 采 蛙 命令“ 图像 增强 图像 平 消 ” 来 观 
察 处 理 效果 。 


5.3.4 НЛ) 


利用 平均 和 借 板 的 平 清 在 消除 噪声 的 同时 也 使 图 
АР ЗЛ, mu FE F E Eee Fe Y < P gl 
Ж, IHH OFDM Е ТЕЛУ Н] NIL RB SCO де Дун] Et t 
J. оК Н ТЛ а АЧ, Tae a lun pe l 
НУРЕ, BIR ER J kuat 4roFTE, ТЕ 
JERE ЈА bk SB 478, ARRA НАЕ БЕ Т е 
>, хе А УЙ Н) КЫЛЫН & 


那么 怎样 判断 该 局 部 区 域 是 包含 噪声 的 需要 平 
滑 的 区 域 还 是 无 明显 噪声 的 不 需 平 请 的 区 域 呢 ? 这 
要 基于 噪声 的 性 质 来 考虑 ，5.3.1 小 节 讨论 了 图 像 的 
局 部 连续 性 质 ， 噪 声 的 存在 会 使 得 在 噪声 点 处 产生 
灰 度 跳跃 ， 从 而 使 噪声 点 局 部 区 域 灰 度 路 上 度 较 大 。 


因此 可 以 选择 如 下 两 个 标准 中 的 1 个 作为 局 部 区 城 
仔 在 噪声 的 判 扼 。 


(1) 局 部 区 域 好 大 值 与 最 小 值 之 过 大 于 茶 一 
БИНТ, БЇ: 


max( R)-min(R)> T, ЖЕН R RKRIZ KK 
域 。 


(2) АКГ ВИН T, В: 
D(R)>T, D( R )X'r.1.1 UJ. R 1722. 
自 适应 滤波 算法 的 实现 逻辑 如 算法 5.1 所 示 。 


算法 5.1 


逐 行 扫 摘 图 像 
对 每 一 个 像 尿 ， 以 该 像 了 尿 作为 中 心 ， 计 算 其 周围 区 域 A 


如 果 区 域 R 


的 特征 满足 选 定 的 噪声 判 据 
根据 选 定 的 模板 计算 邻 域 加 权 和 作为 该 点 的 啊 应 ; 
СШ 


不 处 理 访 点 ; 





对 于 那些 噪声 位 置 具 有 随机 性 和 局 部 性 的 图 
Ж, Ал А ЧЕ НОСЯ ЭО 
者 可 目 己 编制 程序 实现 目 适 应 的 局 斯 平 请 算法 ， 应 
用 于 有 具有 上 述 特 操 的 噪声 图 像 中 ， 开 且 和 本 章 给 出 
的 祭 准 局 斯 平 清 效 来 进行 比较 。 


5.4 FEI 


АЕ ЛА Ее АНЕЛ ЈЕ ав Р 
Б И s Gi. j) РЕЧЕ IZ а Ау С АЈА 
питает (i, j) AJIN 
w. 


中 值 不 同 于 均值 ， 是 指 排序 队列 中 位 于 中 间 位 
н лс НИВ, И: 采用 3x3 中 值 小 波 促 ， 菜 所 
(i, j) 的 8 个 邻 域 的 一 系列 像素 值 为 : 12、18、 
18、11、23、22、13、25、118。 统 计 排 序 结果 
JJ: 11、12、13、18、18、22、23、25、118。 排 
在 中 间 位 置 ( 第 5 位 〉， 的 18 即 作为 G, j) 点 中 值 
шы (i; j) WA, MEWY I JER TENE 
УЖ o 


5.4.1 性 能 比较 
中 值 滤 波 对 于 某 些 类 型 的 随机 噪声 具有 非常 理 


想 的 降 噪 能 力 ， 对 于 线性 平滑 滤波 而 言 ， 在 处 理 的 
像 系 邻 域 之 内 包含 噪声 点 时 ， 品 声 的 存在 忌 会 或 多 
或 少 的 影响 翅 扣 的 像 系 值 的 计算 ， (对 于 局 斯 平 

消 ， 影 啊 程 度 同 噪声 点 到 中 心 点 的 距离 成 正比 ) ， 
{ЫЕ 188059, Бе а Д е E н 

НУ: По Н.Е аа Н ЕМ, HEIE ТЕ ЕЕ 
ИНЕ] | EE ep СЛУ ВМК HAVEY h 2 
МА E YK BRIL 9. 


Раста 6 F W ARN, A 
给 出 中 值 滤 波 的 MATLAB 和 Visual C++ 实现 。 


1， 噪 声 模型 


MATLAB 中 为 图 片 加 噪声 的 语句 代码 如 下 。 


J = imnoise(I,type,parameters); 


参数 说 明 : 


° J 为 原 图 像 ; 
° 可 选 参数 type- 指定 了 噪声 类 型 ， 常 用 的 噪声 类 
型 如 表 5.5 所 示 。 
表 5.5 ”type 合法 取 值 的 功能 描述 


| í í í í í í í í í í í í í í í í í í í 


合法 取 功能 描述 











值 

高 斯 白 噪声 ， 如 果 一 个 噪声 ， 它 的 幅度 分 布 服从 高 斯 分 布 ， 则 称 之 为 高 斯 噪 

gaussian | 声 ， 它 的 功率 谱 密度 〈 功 率 谱 的 概念 见 第 6 章 ) 又 是 均匀 分 布 的 ， 则 称 它 
为 高 斯 白 噪声 














像 传 感 副 、 传 输 信道 、 解 码 处 理 等 产生 的 黑 日 相间 的 膨 瞳 点 噪声 。 椒 盐 品 声 往 
往 是 由 图 像 切割 引起 的 





椒盐 噪声 因 其 在 图 像 中 的 表现 形式 而 得 名 ， 如 图 5.6 (b) 是 对 图 5.6 (а) 中 的 图 
'salt & “| 像 添加 了 株 盐 噪声 后 的 效果 ， 黑 点 如 同 胡 椒 ， 白 点 好 似 盐 粒 。 椒 盐 吕 声 是 由 图 
pepper 


返回 值 : 


ЈИ у RF Ja Н). 


使 用 imnoise (°вацѕѕіап’, т, у) WIARA, А24 BRA 
АЧ 2628) ЛАВИН Уут. JEN НТА РЕ ВЕЛЛ, 
МЕА. “1шт=0Ҥ], BUNN EvE КИЕ f ТЕО BJ BB 8 
样本 《高 斯 分 布 密度 图 数 fCo9 在 x=0 附 近 具 有 最 大 值 ) 有 一 个 较 大 的 概 
率 产 生 值 ， 从 而 大 部 分 的 像 系 位 置 对 原 图 像 有 影响 较 小 。 


2. 中 值 滤 波 的 MATLAB 实 现 


MATLAB 提 供 了 medfilt20) 函 数 实 现 中 值 滤 
波 ， 原 型 如 下 。 


I2 = medfilt2(I1, [m,n]); 


参数 说 明 : 


° _[ _12E J S] ERE, 
° m їп 是 中 值 滤波 处 理 的 模板 大 小 ， 默 认 3x3。 


j eÉ: 
е HI 226 НЕСЕ H BRAE F. 
[5.2] XAA R E JF AR EIT ШЖ. 


下 面 的 程序 分 别 给 出 了 对 于 一 幅 受 椒盐 噪声 污 
染 的 图 像 ， 平 均 平滑 、 高 斯 平滑 和 中 值 滤波 的 处 理 
效果 。 其 相关 代码 如 下 。 


>> І = imread('lena_salt.bmp'); 

imshow(I); % 得 到 图 5.6 (a) WRZ 
J=imnoise(I,'salt & pepper ');% 为 图 像素 加 椒盐 噪声 
figure, imshow(J); % 得 到 网 5.6 (b) 的 图 像 
w = [1 2 1; 

2 4 2; 

1 2 1] / 16; 
J1=imfilter(J, w, 'corr', 'replicate'); % 高 斯 平滑 
figure, imshow(J1); % 得 到 图 5.6〈c) 的 图 像 
w = [1 1 1; 

1 1 1; 

1 1 1] / 9; 
J2=imfilter(J, м, 'corr', 'гер1ісате'); FIPE 
figure, imshow(J2); 5/52 5.6 (а) 的 图 像 
]3=medfilt2(],[3,3]);% 中 值 滤波 
figure, imshow(J3); % 得 到 图 5.6〈e) 的 图 像 





程序 的 运行 结果 如 图 5.6 所 示 ， 从 中 可 见 线性 平 
清 滤波 和 在 降 品 的 同时 不 可 如 免 地 造成 了 模糊 ， 而 中 
IE LEWE A RIRIA ER R PA BY [E] ET EREA R BH St AR 
(926, AA TARRE RERA, HAIEN 
还 还 优 于 线性 平 清 尖 小 。 


3， 中 全 滤波 的 Visual C++ 实现 


利用 Visual C++ IN FE AE YX MA RARI dH 
Е. 


ОИРУ РИИ Р 


void CImgProcess::MedianFilter(CImgProcess *pTo, int nF 
ilterH, int nFilterW, int nFilterMY, int nFilterMX) 
HE JEY 
AP AC EBR өн, URRA, AR MENAR 
CImgProcess* pTo: 目标 图 像 的 CImgProcess 指针 
int nFilterH: 滤波 器 的 高 度 
int nFilterW: 滤波 器 的 宽度 
int nFilterMX: 滤波 器 的 中 心 元 素 Y 坐 标 
int nFilterMY: 滤波 器 的 中 心 元 素 X 坐 标 
返回 值 : 无 
крк ЕЕЕ ЕЕ ИРТ у. 
void CImgProcess::MedianFilter(CImgProcess *pTo, int nF 
ilterH, int nFilterW, int nFilterMY, int nFilterMX) 


l 


pTo->InitPixels(0); // 初 始 化 目标 图 像 








(с) Зз арР 





Е w" a ч m 
ar 
| 


(е) 3x3rh(8 ФЕ ЕАС (f) КОЙШ RT W aH: 


图 5.6” 几 种 滤波 器 对 于 椒盐 噪声 污染 图 像 的 性 能 比较 


int i, J, k, 1; 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


int nGray; 


int* pAryGray; // 邻 域 像 素数 组 
pAryGray = пем int[nFilterH * пРі1+еги |; 


// 117311191, 3748 
for(i = nFilterMY; i < nHeight - nFilterH + nFilterMY 
+ 1; i++)// 行 (除去 边缘 儿 行 ) 
l 
for(j = nFilterMX; j < nWidth - nFilterW + nFilterM 
X + 1; j++)// (Ж ЛЖ) 


l 
// 读 取 滤波 器 数组 
for (k = ð; k < nFilterH; k++) 
{ 
for (1 = 0; 1 < nFilterW; 1++) 


// 原 图 像 第 i + k - nFilterMY 行 ， 第 j + 1 - nFilte 


FMX 列 的 像素 值 
nGray = GetGray(j + 1 - nFilterMX, і + k -nFil 


terMY); 


// 你 和 存 像 系 值 
pAryGray[k * nFilterW + 1] = nGray; 


}//1 
}//k 


nGray = GetMedianValue(pAryGray, nFilterH * nFilte 
rW); ЕНЕЛ АХ F E 
pTo->SetPixel(j, i, RGB(nGray, nGray, nGray)); // 
以 中 值 作为 响应 
}//j 


}//i 
delete [] pAryGray; 


) 





РЁ Ж МейапЕшШег) 1] H] / 3 HZ fE y rH E HJ 
GetMedianValue0) 方 法 ， 其 实现 如 下 。 


省 


int CImgProcess::GetMedianValue(int * pAryGray, int nF 
ilterLen) 
功能 : RH EWA RHITH, HR E AHR H HE. 
参数 : int * pAryGray: 要 排序 提取 中 值 的 数组 
int nFilterLen: 数组 长 度 

返回 值 : int HË 

下 
int CImgProcess::GetMedianValue(int * pAryGray, int nFi 
lterLen) 
{ 

int i, J; 

int nMedianValue; 

int nTemp; // 中 间 变 量 


// 排 厅 
for (3=0; j < nFilterLen - 1; j++) 


for (i=0; i < nFilterLen - j - 1; i++) 


l 
if (pAryGray[i] > pAryGray[i + 1]) 


{ 
// 交换 位 置 
nTemp = pAryGray[i]; 
pAryGray[i] = pAryGray[i + 1]; 
pAryGray[i + 1] = nTemp; 


}//if 
}//for i 
}//for j 


// ЯНИЕ 
if ((nFilterLen & 1) > 0) 


l 
// AUA GF лж, ЖБ [8] 4570 
nMedianValue = pAryGray[(nFilterLen + 1) / 2]; 
J 


else 


l 
// 数组 有 偶数 个 元 素 ， 返 回 中 间 两 个 元 素平 均值 
nMedianValue = (pAryGray[nFilterLen / 2] + pAryGray 
[nFilterLen / 2 + 1]) / 2; 


} 
// 返回 中 值 


return nMedianValue; 


) 


А) Н MedianFilter( РЁ #551 TH IB WEY HJ 5с 7 
ВЕ рТРрето Г. P ПУ А р 4 уоіа 
CDIPDemoView::OnENHAMidianFO 中 ， 其 中 调用 


MedianFilter() 11015 r Br ill F тх o 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 MedianFilter() 函 数 中 值 滤波 
imgInput.MedianFilter(&imgOutput, nFilterH, nFilterW, n 
FilterMY, nFilterMX); 


// 其 中 hnFilterH、nhFilterw 分 别 为 模板 的 高 和 宽 ，nFilterMY 和 nmF 
ilterMX 分 别 为 模板 中 心 的 y 和 x 坐 标 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 ， 会 弹出 对 话 框 要求 用 户 设 置 
中 值 滤波 的 参数 。 旋 者 可 以 通过 光盘 中 示例 程序 
DIPDemo 中 的 来 单 命 令 “ 图 像 增 强 ” 中信 滤波 ?来 观 
察 处 理 效果 。 


5.4.2 一 种 改进 的 中 值 滤 波 朱 上 略 


中 值 小 波 效 采 依 赖 于 滤波 窗口 的 大 小 ， 太 大 会 
(9227 25099900, KMI ЛУ [АШЕР PA HI 
JZ БАН ЕАР ВЕУ НИК, aB rH 46 
БҮК (EU AS БЕ pi да АХ ЈУЧЕ АИК, < — E e Se ДВС 
AJ R JK B. MERE ЛОРИ 
素 的 极 值 ， 而 边缘 往往 不 是 ， 因 此 可 以 利用 这 个 特 
性 来 限制 中 值 滤波 。 


具体 的 改进 方法 如 下 : 逐 行 扫描 图 像 ， 当 处 理 
h МЯН, FIZER E rize key А LI PH + mi 
ЗИ я ПУ Kak МА, ПЖ ле, ДЖЕ 
п HI HEIE ZAR, ШЖ ле, ЛАК 
ВИ, ЕА О ВЕНЕ A ЖОЙЫ | МЕ 


Рі, АЕА, WILFA. 
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选择 执行 不 同 的 操作 ， 因 此 改进 的 中 值 滤波 也 称 为 
月 适应 中 值 滤波。 


目 适 应 中 信 涛 小 算 法 航 封 乡 在 CImgProcess 基 
的 AdaptiveMedianFilter0O 方 法 中 。 其 实现 类 似 于 标 
准 中 值 滤 波 函 数 MedianFilter()， 这 里 不 再 给 出 完整 
代码。 只 需 在 MedianFilter() 孙 数 for 人 循环 最 后 设置 像 
素 为 中 值 的 语句 加 上 一 个 直 的 判断 好 辑 ， 如 下 所 
Ду о 


// 判 断 当 前 像素 是否 是 邻 域 的 极 大 或 极 小 值 
if( (GetGray(j, i) == рАгубгау[@]) || (GetGray(j, i) == 
pAryGray[nFilterH * nFilterW - 1]) ) 
pTo->SetPixel(j, i, RGB(nGray, nGray, nGray)); // 以 中 
值 作为 啊 应 


else 
pTo->SetPixel(j, i, GetGray(j, 1)); // 不 是 极 值 则 不 改变 原 
图 像 的 值 





利用 AdaptiveMedianFilterO 函 数 实现 目 适 应 中 
值 涛 波 的 完整 示例 和 极 封 痛 在 DIPDemo 工 程 中 的 视 移 
英国 数 void 
CDIPDemoView::OnENHAAdaptMidianF() 中 ， 其 中 
调用 AdaptiveMedianFilter() 函 数 的 代码 片断 如 下 所 


Дуо 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 AdaptiveMedianFilter() 函 数 自 适 应 中 值 滤波 
imgInput.AdaptiveMedianFilter(&imgOutput, nFilterH, nFi 


lterW, nFilterMY, nFilterMX); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





斌 者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 有 瑟 
时 命令 “图 像 增 强 目 适应 中 值 滤 波 ” 来 观察 处 理 效 
果 ， 如 图 5.6 (f) 所 示 。 对 比 图 5.6 (f) 和 图 
5.6 (e) ， 不 难 发 现 ， 图 5.6 (£) 在 完美 地 滤 除 了 椒 
ЖЕН рн ҢА], ТЕЙМ п Сиш [ШЗ E, 
较 图 5.6 (е) 有 了 更 好 地 保留 ， 其 他 边 绿 也 更 加 请 
上 晰 ， 基 本 和 原 图 一 致 。 


5.4.3 ”中 值 滤波 的 工作 原理 


与 线性 平 请 小 波 考 谍 邻 域 中 每 个 像 了 系 的 作用 不 
闻 ， 中 值 滤波 在 每 个 n xn 邻 域内 都 会 忽略 挥 那 些 相 
ХР РУ Жа Жах Жа БН Ер Н ИН, IFEA h 
区 域 小 于 像素 总 数 一 半 (п 2/2) 的 像素 的 影响 ， 而 
实际 上 满足 这 样 条 件 和 被 名 略 挥 的 像 系 往 往 束 是 品 


уче 
注意 

作为 一 种 非 线性 滤波 ， 中 值 滤波 有 可 能 会 改变 图 像 的 性 质 ， 因 而 
一 般 不 适用 于 像 军事 图 像 处 理 、 医 学 图 像 处 理 等 领域 。 


5.5 И, 


КЧ КЕНЕ H HI хе О Н BAZE SH JJH BI 
ж Ж» RMH Z, МЕЗЕ] L AS 12 E 
系统 的 指 寻 等 。 


5.5.1 理论 基础 


图 像 锅 化 主要 用 于 增强 图 像 的 灰 度 跳 变 部 分 ， 
这 一 点 与 图 像 平 请 对 灰 度 跳 变 的 抑制 正好 相反 。 事 
实 上 从 平滑 与 锅 化 的 两 种 运算 算 子 上 也 能 说 明 这 一 
扩 ， 线 性 平 背 部 十 基 于 对 图 像 邻 域 的 加 权 求 和 或 者 
WIRDS, ПП НИШУ ЖИЛЕ ИГ КЕ Оф 
В) 或 者 说 有 限 关 分 来 实现 。 


在 讨论 平 铺 的 时 候 本 章 提 到 了 噪声 和 边 绿 都 会 
BE E JK Ep ЛЕ, K T EPE НЕЗ КН БЕ pa ДП 
边缘 区 别 对 竺 还 在 5.3.5 小 节 中 给 出 了 一 种 目 适 应 滤 
波 的 解雇 方案。 同样 地 ， 在 锐 化 处 理 中 如 何 区 分 开 
噪声 和 边 缘 仍 然 是 读者 要 面临 的 一 个 读 题 ， 只 是 在 


ЎН He FS JASA, Эт НАШ A ШИР AKUZ, 
Irpa ri ЗЕЛ НЧ RELA, r EE Mb A 221 


及 噪声 。 
5.5.2 Ж-А: i—i 
КТ 

| К НАЛЕ ЈЕ У, РОЈ 


TERA (х, у), REAR, у)ЖН ЛЕ КТ 
HJ EZ] [н] ж: 


(5-8) 





其 中 : бер, уц (х, y) 处 对 x 的 


Iis: 


fir yte 





ay 
dy o ! а 


)- Ау) | 为 在 点 бз, у) hhf 对 y НАЈ 


= 
J о 


п 梯度 的 方向 就 是 函数 f(x，y ) 最 大 变化 率 的 方 


标 度 的 幅 值 作为 变化 紊 大 小 的 上 度量， 其 值 为 


(е) = VU) +( 


对 于 离散 的 二 维 离 散 函 数 / (i，j) ， 可 以 用 
有 限 兰 分 作为 梯度 幅 值 的 一 个 近似 ， 如 下 式 所 示 。 


ул = ЛЛ@+1,) — fü Р + [fü j+ 1) — FG, j) 
(5-9) 
ДМ ИА В РА жт < АЈА E Z< ba HJ < 
51], ХНЕУ q kb E rH je ЛЕВУ, ЕХ 
27, B E IKIT ЕТА КАЛЕ ç 


上 去 中 包括 平方 和 开 方 ， 不 方便 计算 ， 因 此 可 
近似 为 绝对 值 的 形式 : 


Vj) = |fü +1,j) — füü,j)| + |fü,j + 1) — 0,3) 


(5-10) 
而 在 实际 使 用 中 ， 经 第 被 采用 的 是 另外 一 种 近 


ЛД E Вобегі У: 


ЕЛ ЕНА а ЕЕ Ч е a l) 





(5-11) 


1. Robert% У 


Robert МЕЛЕ У БУ НУ uH F o 
а= 7 u = | "g 


其 中 ，w 1 对 接近 45* 边 缘 有 较 强 响应 ，w 2 对 接 
近 -45" 边 缘 有 较 强 啊 应 。 


【 例 5.3】 2E--Robert%: V BJ НЕ ИУ 
例 。 


有 了 前 面 学 习 的 滤波 的 知识 ， 只 要 分 别 以 w1 
Mw 2 为 模板 ， 对 原 图 像 (a) 进 行 滤波 就 可 得 到 G 1 和 
G 2， 而 根据 公式 (5-11) 最 终 的 Robert 交 叉 梯 度 图 
Ë (b) X: G=|G 1|+1|G 2|。 


在 进行 锐 化 滤波 之 前 谈 者 要 将 图 像 类 型 从 uint8 
转换 为 double， 这 是 因为 锐 化 模板 的 负 系 数 常 常 使 
得 输出 产生 负 值 ， 如 果 采 用 无 人 符 亏 的 uint8 型 ， 则 负 
值 会 被 截断 。 


在 调用 疯 数 imfilter() 时 ， 还 要 注意 不 要 使 用 球 
认 的 填充 方式 ， 因 为 MATLAB 默 认 会 在 滤波 时 进 
行 “0? 捧 苑 ， 这 会 导致 图 像 在 边 寞 处 产生 一 个 人 为 
WERE, MWEE BAP E m, 
E6 Л N m ЇНЇ ME RF ERK FBO ЖЕН REW 
ARAE H ER GRATI KI ME 30) tH ЖЮ Ж BN rh 


ВАА ТЕ AK е ИЧ Д Bl, [НЫД ЩИ» JS HJ 
AW. АХ H <H) / “герсаге”Н] = £ JH 2; J 
式 ， 也 可 采用 “symmetric” 的 对 称 填 充 方 式 。 


程序 编程 实现 如 下 。 


>> I = imread('bacteria.bmp'); 
>> imshow(I); % 显示 图 5.7(a) 
>> І = double(I); % 转换 为 double 型 ， 这 样 可 以 保存 负 值 ， 和 否则 
иіпе8 H ZJE PEERI 
= [-1 0; © 1] 


>> w2 = |6 -1; 1 Ө] 
w2 = 

Ө -1 

{| Ө 
>> 61 = imfilter(I, м1, 'corr', 'replicate'); % 以 重复 
пя Я 
>> G2 = imfilter(I, м2, 'corr', 'гер1ісаїе'); 
>> G = abs(G1) + abs(G2); % 计算 Robert 梯 度 
>> figure, imshow(G, []); % :755.7(60) 
>> figure, imshow(abs(G1), []); % 显示 图 5.7(c) 
>> figure, imshow(abs(G2), []); % 显示 图 5.7(d) 





上 述 程 序 的 运行 结果 如 图 5.7 所 示 。 由 于 G 1 和 
G 2 中 都 可 能 有 人 负 值 ， 图 5.7 (с) 和 图 5.7 (d) 分 别 
是 对 G 1 和 G 2 取 绝 对 值 后 的 图 像 ， 图 5.7(c) 中 接 
近 45? 边 缘 较 明显 ， 而 图 5.7 (а) 中 则 突显 出 接 


这 -45° 方 同 的 边 绿 ， 这 与 且 接 分 析 w 1 和 w 254525 
构 得 出 的 结论 是 一 致 的 。 





(с) wl 滤波 后 取 绝 对 值 并 重新 标定 Са) Ww2 滤 波 后 取 绝 对 值 并 重新 标定 
图 5.7 ”Robert 交叉 梯度 馈 化 





为 便于 观察 效果 ， 图 5.7 (b) 、 图 5.7 (c) 、 图 5.7 (d) 都 做 了 显 
示 时 的 重新 标 和 ， 即 将 图 像 的 灰 度 范围 线性 变换 到 0 一 255 之 内 并 使 得 
图 像 的 最 小 灰 度 值 为 0， 最 大 灰 虚 值 为 255。 在 MATLAB 中 只 需 在 用 


іп1ѕһом() РА З W 7 RAN IANA% [ ] 即 可 。 
2. $оЬе Ж 


由 于 滤波 时 读者 总 是 喜欢 奇数 尺寸 的 模板 ， 
而 一 种 计算 Sobel 梯 度 的 Sobel 模 板 更 加 常用。 


对 水 平 边 缘 有 较 大 响应 的 竖 直 梯度 “ 注 ， 对 竖 直 边缘 有 较 大 响应 
的 水 平 梯度 


下 和 面 的 MATLAB 程 序 计算 了 一 幅 图 像 的 竖 直 和 
水 平 樟 度 ， 它 们 的 和 可 以 作为 完整 的 Sobel 梯 上 度 。 相 
天 代码 如 下 。 





I = imread('bacteria.bmp'); % 谈 入 原 网 像 
>> м1 = fspecial('sobel'); % 得 到 水 平 sobe1 模 板 
>> wl 


w1 = 

1 2 1 

Ө Ө Ө 

-1 -2 -1 
>> м2 = w1' % 转 置 得 到 竖 下 soble 模 板 
W2 = 

1 0 -1 

2 2 -2 


1 Ө =1 


G1 = imfilter(I, м1); % 水 平 Sobe1 梯 度 
G2 = imfilter(I, м2); %% Ёѕоре1% j% 


1 
2 


>> б = abs(G1) + аЬѕ(62); %Ѕоре1% j% 

>> figure, ітѕһом(61, []) % 得 到 图 5.8 (а) 
>> figure, ітѕһом(62, []) % 得 到 图 5.8 (b) 
>> figure, ітѕһом(б, []) % 得 到 图 5.8 (с) 





上 述 程序 运行 后 ， 图 5.7 (а) 的 Sobel 梯 度 锐 化 
效果 如 图 5.8 所 示 。 





(а) Sobel 梯 度 图 像 СЪ) w1 滤 波 后 取 绝 对 值 并 重新 标定 ”《〈c) w2 滤 波 后 取 绝 对 值 并 重新 标定 
图 5.8 ”Sobel 梯 度 锐 化 效果 ， (b) 中 接近 水 平方 向 的 边缘 较 明 
To (c) 中 接近 竖 直 方 癌 的 边缘 较 明 显 


还 可 以 直接 利用 MATLAB 梯 上 度 函数 gradientO 计 
Sobel, JEFA F -o 





>> I = imread('bacteria.bmp'); 

>> мизан 

>> І = double(I); % 计算 梯度 之 前 要 转换 为 doubjle 
>> [Gx Gy] = а % VL х,у 
>> G = abs(Gx) + abs(Gy); % 计 算 整 体 梯度 

>> figure, imshow(G); 


>> figure, imshow(G, []); % 整体 梯度 图 像 
>> figure, imshow(Gx, []); % x 方向 梯度 图 像 (突显 偏 竖 直方 癌 


的 边缘 ) 
>> figure, imshow(Gy, []); % y 方 向 梯度 图 像 (突显 偏 水 平方 问 
的 边缘 ) 





3. Sobel% E WJ Visual C++ 实现 


A >P фе Y FilterSobel() J ERR Sobel 
ОЛЕ ЧИННИКИ. 


站 


void CImgProcess::FilterSobel(CImgProcess Process*pTo) 
功能 : Sobel 梯 度 
参数 : ImgProcess* pTo: 目标 输出 图 像 的 CImgProcess 指针 
BEE: Æ 

TK KE P ЕКЕ ЕЕ ЕРЕ ЕТЕ TEETE 

void CImgProcess::FilterSobel(CImgProcess *pTo) 

{ 
CImgProcess іте1, img2; 
img1 = *pTo; 
img2 = *pTo; 


Template(&img1, 3, 3, 1, 1, Template HSobel, 1); 
Template(&img2, 3, 3, 1, 1, Template VSobel, 1); 
*pTo = img1 + img2; 





АІ H FilterSobel( РЁ 55 5оЬеГ  /Л##® НУС 
ЖЯ ту [7 Д5 ЧЫ] ЭЖ ТЕШРОешто TFE F ВУХ 2 pd уоіа 


CDIPDemoView::OnEnhaGradsharpO 中 ， 其 中 调用 
FilterSobel0 K ИКУ А тп F TZR o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 FilterSobel() 水 数 进行 Sobel 梯 度 锐 化 
imgInput.FilterSobel(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “图 像 增强 梯度 锐 化 ”来 观察 处 理 效 果 。 


天 于 梯度 算 子 更 详细 的 讨论 留 在 第 12 章 图 像 分 
ШЕР 


5.5.3 АЕ ЪЁД? Н) A оа —— t 
拉 斯 算 子 


下 面 介 绍 一 种 对 于 图 像 锐 化 而 言 应 用 更 为 广 谤 
的 基于 二 阶 微 分 的 拉 普 拉 斯 (Laplacian) 算 子 。 


1. 理论 基础 


ЁрЁ (х,у) ИД MEMET ) 


定义 为 : 


| С 5 
у) д 
| дт” ФР 


(5-12) 


对 于 离散 的 二 维 图 像 f(i,j)， 可 以 用 下 式 作 为 
对 二 阶 偶 做 分 的 近似 : 


J 1,7) — fien) 0,8) = fü — 1.j)) = fü +1,j) + fi 1,7) – 27f(,7) 
= { f (z. j + 1) 一 fü. 了 中 一 (Р. 1) — fii. Ji =. 1+ 1) + fii. 了 一 1) 一 2 f (G. 1) 


СЕРА ААЛА АПАЛАР МА ЕН 


V f= [++ (1, р) fü,j+ 1)+ (7 —1) — 4f(,7) 


(5-13) 


对 应 的 滤波 模 极 如 下 : 


0 1 0 
И1= |1 —4 1 
0 1 0 


因为 在 锐 化 增强 中 ， 绝 对 值 相同 的 正 值 和 负 值 
实际 上 宸 示 相 同 的 响应 ， 故 也 等 同 于 使 用 如 下 的 模 
板 W 2: 


分 析 拉 普 拉 斯 模板 的 结构 ， 可 知 这 种 檬 板 对 于 
909 的 旋转 是 各 向 同性 的 。 所 谓 对 于 某 角 度 各 向 同 
性 是 指 把 原 图 像 旋 转 该 角度 后 再 进行 滤波 与 先 对 原 
图 像 滤波 再 旋转 该 角度 的 结果 相同 。 这 说 明 拉 普 拉 
斯 算 子 对 于 接近 水 平和 接近 紧 直 方 加 的 边缘 都 有 很 
好 的 增强 ， 从 而 也 就 避免 读者 在 使 用 梯度 算 子 时 要 
进行 两 次 滤波 的 矿 烦 。 更 进一步 ， 谍 者 还 可 以 得 到 
如 下 对 于 459 旋转 各 回 同 性 的 滤波 大 : 


沿用 高 斯 平滑 模板 的 思想 ， 根 据 到 中 心 点 的 距 
离 给 模板 周边 的 点 赋予 不 同 的 权重 ， 还 可 得 到 如 下 
的 模板 W 5: 


2. MATLAB IN 


分 别 使 用 上 述 的 3 种 拉 普 拉 斯 模板 的 MATLAB 
滤波 程序 如 下 。 


I = imread('bacteria.bmp'); 
figure, imshow(I); % 得 到 图 5.9 (а) 
I = double(I); 

= [9 -1 0; -1 4 -1; © -1 ð] 


-1 0 

4 -1 

-1 0 
L1 = imfilter(I, wl, 'corr', 'replicate'); 
Мо [ei sq a1 Q 8 sa st #1 si] 
-1 -1 -1 
-1 Š -1 
-1 -1 -1 
L2 = imfilter(I, w2, 'corr', 'replicate'); 
figure, imshow(abs(L1), []);%{5®] 5.9 (b) 
figure, imshow(abs(L2), []);%{52] 5.9 (c) 

= [1 4 1; 4 -20 4; 14 1] 


1 

-20 4 

1 
L3 = imfilter(I, w3, 'corr', 'replicate'); 
figure, imshow(abs(L3), []);%58®] 5.9 (d) 





上 述 程 友 运行 结果 如 图 5.9 所 示 。 对 于 细 落 图像 
拉 普 拉 斯 267 Е Z 3 A Robert ЅоБе В “> 
НҢ ж УН] A еН КИЙНН НУ АЯЛ %„ УЬ, 

者 还 会 注意 Ga 拉 斯 锐 化 似乎 对 一 些 离散 点 有 较 
强 的 啊 应 ， 当 然 由 于 噪声 也 是 离散 点 ， 因 此 这 个 性 
质 有 时 是 谍 者 所 不 硕 望 的 。 





(b) 利用 的 模板 拉 普 拉 斯 倍 化 





(с) НИЧЕ ИВМ Са) 利用 5 模板 拉 普 拉 斯 锐 化 
5.9 ” 拉 普 拉 斯 锐 化 效 琳 
3. Visual C++ 实现 
只 雷 以 预定 义 的 拉 普 拉 斯 模板 作为 参数 调用 小 


波 函 数 Template0 即 可 实现 拉 普 拉 斯 锐 化 。 它 被 封 
JS TEDIPDemo T FE F WALAI Æ A 28rvoid 
CDIPDemoView::OnEnhaSharp0 F, E ZARAS H Wr 
ИПТАХ: 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 设置 拉 普 拉 斯 模板 参数 
nTempW = 3; // 模 板 宽 度 
nTempH = 3; // 模 板 高 度 
fCoef = 1.0; // 模 板 系数 


n TempMX 
n TempMY 


1; // 模 板 中 心 x 坐 标 
1; // 模 板 中 心 y 坐 标 


// 调用 Template( ) 函 数 用 拉 普 拉 斯 模板 锐 化 
imgInput.Template(&imgOutput, nTempH, nTempW, nTempMY, 
nTempMX, Template Laplacian2, fCoef ) ; 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





庶 者 可 以 迪 过 光 检 中 示例 程序 DIPDemo 中 的 采 
时 命令 “图 像 增强 拉 普 拉 斯 锐 化 ”来 观察 处 理 效 
Ж. 


5.5.4 ”基于 一 阶 与 二 阶 导 数 的 锐 化 算 子 的 
z 


5.5.2 小 人 和 5.5.3 小 和 中 分 别 介 绍 了 基于 一 阶 寻 
数 的 Robert 和 Sobel] 算 于， 以 及 基于 二 阶 导 数 的 
Laplacian 算 于， 并 且 通 过 图 5.8 一 图 5.9 从 直观 上 观 
察 和 比较 了 它们 的 处 理 效 果 。 下 面 将 进行 更 为 精确 
的 分 析 和 比较 ， 以 找到 一 些 能 够 在 实践 中 有 具有 指导 
意义 的 一 般 性 规律 。 


设 图 5.10 最 上 面部 分 的 灰 上 腻 训 面 图 对 应 于 图 像 
中 的 一 条 具有 代表 性 的 水 平 像素 线 ， 其 中 包括 了 灰 
度 较 组 变化 的 斜坡 〈 软 边缘 ) n IOLA GRE REA 
噪声 ) 、 细 线 〈 细 节 ) ， 以 及 灰 度 跳 变 的 阶梯 〈 硬 
边 绿 ) 。 为 了 人 简 蛙 起见 ， 考 虑 图 像 中 只 有 8 个 灰 度 
级 的 情况 。 图 5.10 中 下 面 的 一 行 给 出 了 这 条 像素 线 
中 各 个 像素 的 灰 度 值 ， 由 此 计算 出 的 一 阶 微分 和 二 
阶 微分 在 图 中 的 第 3 行 和 第 4 行 中 给 出 。 由 于 这 里 的 
像 系 线 在 图 像 中 是 水 平分 布 的 ， 因 此 式 “5-11〉 和 和 
т (5-13) 可 简化 为 一 维 的 形式 ， 即 一 维 情况 下 的 
7: 

af 


= = f(z + 1) — f(z) 


(5-14) 
AI 28787 КУ М7: 


А = [(жт+1)+ flr- 1) — 2f(z) 
дт 


(5-15) 


7 
I 
6 К ш 
| Ñ ° — 斜坡 细 线 阶梯 下 
FE 3 人 i \ ý ) 
02 Е" / “\ 灰 度 恒定 区 域 N | 
_ е, `. | r Ф 、、 КО | 
ojojo] 0|ololo 





图 5.10 一 阶 与 三 阶 做 分 比较 


通过 分 析 这 个 典型 的 灰 度 变化 檬 型 ， 束 可 以 很 
好 地 比较 品 声 点 、 细 下 以 及 边 绿 的 一 阶 和 二 阶 敏 分 
Ж. 


Н ЖЕМ ЈИ KUR) ， 一 阶 人名 
ЛА: АЕО Ду, HH с У ЕТ 
ARET, ХЛ РАИ ТАС НИ ДУ ЛН ЕЕ 
(这 里 为 -1) ; 而 三 阶 秘 分 的 非 0 啊 应 则 只 出 现在 
冬 坡 的 起 始 和 终点 处 ， 在 灰 度 变化 紊 恒定 的 冬 面 上 
二 阶 做 分 值 为 0%， 这 束 古 图 5.9 中 的 拉 普 拉 斯 钢化 图 
像 细 责 周 围 出 现 双边 缘 的 原因 。 由 此 得 出 结论 ， 对 
ТИНА, МН РЕ ВОН НУО 
Ж, Т ДАНТЕ 2. 

РРА Ка а а, ЕА АЈ ИМАТЕ a 


БАШ) Л 80 — ГРС Z, JH pue 5.9 ЕЈ 
Т dr КЕН Hi QE S= Хе HJ nay llu] У У J 


因 ， 当 然 二 阶 微分 的 这 一 性 质 是 谈 者 所 不 希望 的 。 


MRE УЛУ БИЖ ЕШШ, ЮЖН 
ERHI EEE У Т НН ГЮ ДЖ T ЖН ДЕ о ЛАЙ 
Е. 


Жил, с М Р АЛЕН OI ЕЈ 
向 应 ， 只 十 在 三 阶 人 微分 中 有 一 个 从 正 到 人 负 的 过 小 ， 
这 一 性 质 将 在 第 12 革 (边缘 检测 与 图 像 分 割 〉 中 用 
122250901. 


将 这 些 比较 的 结论 总 结 如 下 。 


一 除 寻 数 通 帅 会 产生 较 宽 的 边缘 。 

二 阶 导 数 对 于 阶 跃 性 边缘 中 心 产 生 零 交叉 ， 而 
对 于 屋顶 状 边 绿 细 线 ) ， 二 阶 守 数 取 极 值 。 
二 阶 叶 数 对 细 太 有 和 较 强 的 啊 应 ， 如 细 线 和 拆 六 


н 一 上 ~ 
|l Pra Pia 


ХРИ АП а, ATONE PL f HI 
Z E, КУЕ l iy Ын, ДАГ K tB 
就 更 明显 。 而 在 本 书 第 12 章 讨论 边缘 检测 的 时 候 ， 
基于 一 阶 寻 数 的 复 子 则 会 更 多 地 及 挥 作用 。 尽 过 如 
№, РЕНИ ОХА пка, ЕИ 
w [А] А Е — де DAS Б Rf J H RA 
Ж. 


Á а ЕЛШЕ ЛЕ ЙБ a С n] РАЖ ЖКА Е 
ar HMH, EESAN S LARE Ar t n] pA 
PK J BS йт, AAE FA EARE К а 
ERIE rH U BJ] o 


5.5.5 ЕЕ K H. SE 
1. ка ЛЕЛЕ НУЛА EE 


无 论 是 基于 一 阶 做 分 的 Robert、Sobel 模 板 还 是 
基于 二 除 微 分 的 拉 普 拉 斯 模板 ， 其 中 各 系数 和 均 为 
0。 这 说 明 算 子 在 灰 度 恒定 区 域 的 啊 应 为 0， 即 在 饥 
化 处 理 后 的 图 像 中 ， 原 图 像 的 平 请 区 域 近乎 于 黑 
色 ， 而 原 图 中 所 有 的 边缘 、 细 季 和 灰 度 跳 变 氮 都 作 
为 黑 育 景 中 的 高 灰 度 部 分 突出 显示 。 在 基于 铅 化 的 
多 像 增 强 中 第 彰 布 望 在 增强 边缘 和 细 币 的 同时 仍然 
保留 原 图 像 中 的 信息 ， 而 个 是 将 平 消 区 域 的 灰 度 信 
MER. KE n HEE BHAI EmA J H ENRI EI 
aB AB MZE R o 


南 要 注意 具有 正 的 中 心 系数 和 具有 负 的 中 心 系 
数 的 模板 之 间 的 区 别 ， 对 于 中 心 系数 为 负 的 模板 
(如 w 1, w 3, w 5)， 要 达到 上 述 的 增强 效果 ， 显 然 应 
E нна 

‚ BH: 


gip- 1760 +5аред/ (і), 锐 化 算 子 中 心 系数 >0 
7 (7? -5һагреп(/ї, 7), 锐 化 算 子 中 心 系 数 <0 


(5-16) 
其 中 : Sharpen(. KAKE НУН ЛИТ o 


这 里 仅 以 拉 普 拉 斯 锐 化 为 例 ， 几 5.11 (b) 给 出 
经 式 (5-16) 的 处 理 效 果 。 


图 5.11 (b) 由 于 铅 化 后 边缘 和 细节 处 的 高 灰 虚 
值 的 存在 ， 经 灰 度 伸缩 后 〈 归 一 化 在 [0，255]) ， 
原 匈 灰 度 航 压 缩 在 一 个 很 军 的 范围 内 ， 人 整体 上 显得 
较 上 暗 。 为 了 改善 这 种 情况 ， 对 上 面 介绍 的 方法 进行 
推广 ， 有 具体 的 说 驶 是 在 复合 FG, j ) 和 Sharpen(f (i, j )) 
时 适当 地 提高 f(i, 六 的 比重 ， 形 式 化 地 描述 如 下 。 


та |470, 7) + Sharpen(fG, 7). ВИЯН > 0 
>” |AfG_j-Sharpen(fG 0), 锐 化 算 子 中 心 系数 <0 


(5-17) 


形 如 式 (5-17) 这 样 的 滤波 处 理 束 称 为 蜗 提 升 
滤波 。 





(а) 平滑 后 的 婴儿 照片 baby smooth.bmp (b) 图 像 (a) 经 过 式 (5-16) 处 理 


图 5.11 经 式 (5-16) 的 处 理 效 果 示 意图 


一 般 来 说 权重 系数 A 应 为 一 个 大 于 等 于 1 的 实 
Ж, A 越 大 原 图 像 所 占 比 重 越 大 ， 馈 化 效果 越 不 明 
显 。 图 5.11 b) 对 应 于 A=1 的 情况 ， 图 5.12 (а) 
和 图 5.12 (b) 分 别 给 出 了 当 A 分 别 为 1.8 和 3 时 对 于 
5.11 (a)〉 中 图 像 的 噩 提 升 滤波 的 效果 ， 图 中 细 市 
得 到 了 有 效 的 增强 ， 对 比 度 也 有 了 一 定 的 改善 。 





(a) 图 像 图 5.11 (a) 经 过 高 提升 滤波 ，4=1.8 (Cb) 图像 图 5.11 (а) 经 过 高 提升 滤波 ，A=3 


图 5.12” 噩 提升 滤波 效果 


2. mihe IEX H Visual C++ 实现 
ЖЕЛ ИЕН] H A F3⁄ ERTER o 
(1) BRAM. 
(2) 原 图 像 与 锐 化 图 像 的 按 比例 混合 。 


(3) EAEE GIKO, 
255]) 


在 实现 中 应 注意 高 提升 滤波 对 于 锐 化 图 像 的 响 
应 是 正 还 是 负 是 非常 敏感 的 。 以 拉 普 拉 斯 模板 为 
М], З А У ТЕНТ, ХЕ Е НУЛИ ХУ тт 
KEERA, НАЛУ J IFE 48, 011] ЖЕН 
ЖЫШ 4S 30 EERE 6; Im FEP AEX) H 
点 ， 其 滤波 啊 应 显然 为 负 值 ， 著 加 到 原 图 像 的 效果 
是 使 得 该 点 在 输出 图 像 中 更 暗 。 当 模 极 中心 系数 为 
人 负 时 ， 由 于 原 图 像 与 滤波 啊 应 图 像 之 间 变 成 了 相关 © 
的 关系 ， 珊 提升 的 效果 与 正中 心 系数 的 模板 完全 相 
后。 这样 束 达到 了 党 者 愈 有 党 ， 上 暗 者 僵 暗 的 增强 效 
果 。 因 此 ， 雷 要 适当 地 修改 Template( ) 函 数 中 的 模 
А BE F А5475, По ау Ва. Hh HY Z6 J 


高 提升 滤波 函数 EnhanceFilter( ) 的 完整 实现 如 
下 。 





/ KK K Æ K Æ * K K K K K K K K K K * X 


void CImgProcess::EnhanceFilter(CImgProcess Process*pTo 
› double dProportion, 
int nTempH, int nTempM, 
int nTempMY, int nTempMX, FLOAT *pfArray, F 
LOAT fCoef) 
功能 : 0710804 
参数 : CImgProcess* pTo: 输出 图 像 的 CImgProcess 指针 
double dProportion: 局 提升 小 波 中 原 图 像 的 混合 比例 
int пТетрн: 模板 的 高 度 
int nTempW: 模板 的 宽度 
int  nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( < iTempH - 1) 


int  nTempMX: 模板 的 中 心 元 素 X 坐 标 ( < iTempW - 1) 
FLOAT * fpArray: 指向 模板 数组 的 指针 
FLOAT fCoef: 模板 系数 
BRE: 无 
ee БЕК ЕЕЕ ЕКЕ ЗЕ ПЕ ЕЕЕ 
void CImgProcess::EnhanceFilter(CImgProcess *pTo, doubl 
e dProportion, 
int nTempH, int nTempM, 
int nTempMY, int nTempMX, FLOAT *pfArray, F 
LOAT fCoef) 
l 
int i, J; 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


*pTo = *this; // 目 标 图 像 初 始 化 

//GrayMat 暂 存 按 比 例 闭 加 图 像 (不 能 在 CImg 类 对 象 中 直接 进行 像 
系 相 加 ， 因 为 相 加 的 结果 可 能 超出 施 围 [6,255]) 

vector< vector<int> > GrayMat; 

vector<int> vecRow(nWidth, Ө); //GrayMat 中 的 一 行 (初始 
化 为 ) 

for(i=0; i<nHeight; i++) 

l 

GrayMat.push back(vecRow); 


) 


Г/Л Р, ALL O И ЛУ, jJ ИИ JII 
for(i=nTempMY; i<GetHeight() - (nTempH - nTempMY) + 1 
; i++) 
l 
for(j=nTempMX; j<GetWidthPixel() - (nTempW - nTempM 
X) + 1; j++) 


// (3,1) 
float fResult = 0; 


for(int k=0; k<nTempH; k++) 


l 
for(int 1=0; 1<пТетри; 1++) 


{ 
// 计 算 加 权 和 
fResult += GetGray(j + 1 - nTempMX, і + к - nT 
empMY) * pfArray[k * nTempW + 1]; 


) 


// 来 以 系数 
fResult *= fCoef; 


// 限 制 啊 应 值 汇 围 
if(fResult > 255) 
fResult = 255; 
if(fResult < -255) 
fResult = -255; 


GrayMat[i][j] = dProportion * GetGray(j, i) + fRes 
ult + 0.5;//:2k Rl, ERWE AA 
}//for j 
}//for i 


int nMax = 0;//ÆAKE HHE 
int nMin = 65535; // 最 小 灰 度 和 值 


//Ж ИЛ, ME 
for(i=nTempMY; i<GetHeight() - (nTempH - nTempMY) + 1 
; i++) 
l 
for(j=nTempMX; j<GetWidthPixel() - (nTempW - nTempM 
X) + 1; j++) 


{ 
if( GrayMat[i][j] > nMax) 
пМах = GrayMat[i][ j]; 
if( GrayMat[i][j] < nMin) 
пМіп = GrayMat[i][ j]; 
}// j 
}// 1 


// 将 GrayMat 的 取 人 范围 重新 归 一 化 到 [6，255] 


int nSpan = nMax - nMin; 


for(i=nTempMY; i<GetHeight() - (nTempH - nTempMY) + 1 
; i++) 
l 
for(j=nTempMX; j<GetWidthPixel() - (nTempW - nTempM 
X) + 1; j++) 


BYTE bt; 
if(nSpan > 0) 
bt = (GrayMat[i][j] - nMin)*255/nSpan; 
else if(GrayMat[i][j] <= 255) 
bt = GrayMat[i][ j] ; 
else 
bt = 255; 


pTo->SetPixel(j, i, RGB(bt, bt, bt)); 
y// for j 


}// for i 
J 


А] Н EnhanceFilter() РЁ AEM Fi pe JT Te ВУ с 
整 示例 被 封装 在 DIPDemo 工 程 中 的 视图 类 函数 void 


CDIPDemoView::OnEnhaHighenha() 中 ， 其 中 调用 
EnhanceFilterO 国 数 的 代 但 片断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 相关 参数 议定 

double dProportion = 1.8; // 混 合 比例 
int nTempH = 3; 

int nTempW = 3; 

int nTempMY = 1; 

int nTempMX = 1; 


// WH EnhanceFilter() RAŽ ateJ, ЖШ3х3 Г ар1ас1 
an 模板 ， 混 合 系数 为 1.8 

imgInput.EnhanceFilter(&imgOutput, dProportion, nTempH, 
nTempW, nTempMY, nTempMX, Template Laplacian2, 1); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “图 像 增强 高 提升 滤波 ”来 观察 处 理 效果 。 


5.5.6 ”局 斯 - 拉 普 拉 斯 变换 (Laplacian of a 
Gaussian, LoG ) 
钢化 在 增强 边 绿 和 细 市 的 同时 往往 也 “增强 ”] 


噪声 ， 因 此 如 何 区 分 开 噪 声 和 边缘 是 锐 化 中 要 解 诀 
的 一 个 核心 问题 。 


ZE Br ВЭУ НТА ГАН Mk 
ЛИД AZ SA O 能 产生 更 强 的 啊 应 ， 并 且 各 加 同性 ， 因 
此 在 图 像 增强 中 较 一 阶 的 梯度 拭 子 更 受到 二 者 的 育 
Eo Am, EX TEE AAM E, a AA FI 
XT F 1 ЪаБу поіѕе.Ьтр, ZAE AMER EM Ja lon ps 
更 明显 ， 如 图 5.3 (b) MR. 


为 了 在 取得 更 好 的 锐 化 效果 的 同时 把 噪声 的 干 
扰 降 到 最 低 ， 可 以 先 对 市 有 了 噪 声 的 原始 图 像 进 行 平 
消 小 疲 ， 冉 进行 钢化 增强 边 绿 和 和 细 广 。 本 大“ 强 强 
联合 ”的 原则 ， 将 在 平 请 领域 工作 的 更 好 的 高 斯 平 
清算 子 同 馈 化 界 表 现 突 出 的 拉 普 拉 斯 锐 化 结合 起 
来 ， 得 到 噩 斯 一 拉 普 拉 斯 算 子 (由 Marr 和 Hildreth 
J n ж 


A E u АЖЫ PR 251: 


(г) = —e 22 
(5-18) 

其 中 : Prt, o 为 标准 看 。 
тр СЕВО РЕ ЗРНА ЖИ, JLE HJ 
ЖЕБЕ Но 决定 。 进 一 步 计 自 疡 的 拉 普 拉 斯 算 子 《天 


于 r 求 二 阶 导 数 ) ， 从 而 得 到 敌 名 的 局 期- 拉 普 拉 期 
sJ (Laplacian of a Gaussian, LoG) : 





F = =] —1 
(5-19) 


5.13 展 不 Г ТТоС НУ ЯБА. ДН 
Рае 将 上 式 经 过 离散 化 
可 近似 为 一 个 5x5 的 拉 普 拉 斯 模板 。 
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45.13 ”Laplacian 函数 三 维 图 形 
【 例 5.4】 Laplacian 与 LoG 算 子 的 锐 化 效果 比 


E o 


下 和 面 给 出 了 对 于 图 像 baby.bmp， 分 列 灯 用 
Laplacian 和 LoG 算 子 进行 锐 化 的 MATLAB 实 现 ， 相 
ЖАЛИ» 


>> Т = imread('baby.bmp'); 
>> figure, imshow(I, []); % 得 到 图 5.14 (а) 
>> Id = double(I); % 滤波 前 转化 为 双 精 度 型 
>> h lap = [-1 -1 -1; -1 8 -1; -1 -1 -1] % 拉 普 拉 斯 算 子 
h lap = 
-1 -1 -1 
-1 Š -1 
-1 -1 -1 


>> I lap = imfilter(Id, h lap, 'corr', 'replicate'); % 
Laplacian 锐 化 

>> figure, imshow(uint8(abs(I lap)), []); % 取 绝 对 值 并 将 
25501 FEJET, % 2] 5.14 (b) 


>> 

>> h log = fspecial('log', 5, 0.5); % 大 小 为 5，sigma=6.5 
的 LoG 算 子 

>> I log = imfilter(Id, h log, 'corr', 'replicate'); 

>> figure, imshow(uint8(abs(I log))，[]);% 得 到 图 5.14 (с 

) 

>> 

>> h log = fspecial('log', 5, 2); % 大 小 为 5，sigma=2 的 Lo 
ся 

>> І log = imfilter(Id, h log, 'согг', 'replicate'); 

>> figure, imshow(uint8(abs(I log))，[]);% 得 到 图 5.14 (d) 





上 述 程序 的 运行 结果 如 图 5.14 所 示 ， 图 
5.14 (с) Ж 5.14 (d) 分 别 给 出 了 对 于 图 像 
baby.bmp, 24 =0.5 Mo -2 时 的 LoG 增 强 效 果 。 与 图 
5.14 (b) 相 比 ， 噪 声 得 到 了 有 效 的 抑制 ， 且 。 越 小 
细节 增强 效果 更 好 ，。 越 大 则 平滑 效果 越 好 。 


天 于 局 斯 - 拉 普 拉 斯 变换 更 为 详细 的 内 容 ， 可 
参考 本 书 第 12 章 中 关于 边 绿 检 训 方法 的 讨论 ， 届 时 
也 将 给 出 LoG 算 子 的 Visual C++ 实现 。 





u 





(c) 经 LoG 人 处 理 后 的 图 像 ，o=0.5 (d) 经 LoG 处 理 后 的 图 像 ，o=2 


图 5.14 ”Laplacian 与 LoG 算 子 的 滤波 效果 比较 


HOR ”频率 域 图 像 增强 


空间 域 和 频 难 域 为 使 用 音 近 供 了 不同 的 视角 。 

在 空间 茂 中， 函数 的 目 变 量 (X ，y ) 被 视 为 二 维 空间 
中 的 一 点 ， 数 字 图 像 f (x y) 即 为 一 个 定义 在 二 
维 空间 中 的 埠 形 区 域 上 的 离 敌 孙 数 ， 换 一 个 角度 ， 

WRF Сх, у) 视 为 幅 值 变化 的 三 维 信 与 ， 则 可 
以 通过 东 些 变换 手段 〈 如 傅 里 时 变换 、 离 散 余 路 亦 
和 EMEI PA EE 
行 分 析 。 


БАНЛ T Z= [u] [Б ла Н ЭСАП 
R, кВ аА ЛЕА ++ lZ) Br 4 
像 增强 问题 ， 相 信 这 一 定 会 使 证 者 对 图 像 增强 的 理 
解 更 加 深刻 。 
本 章 的 知识 和 技术 热点 

(1) 傅 里 叶 变 换 的 数学 基础 

(2) EMR E mA 

(з) WKE RAIN E 

(4) 高 通 滤波 器 和 低 通 滤波 器 


(1) 美女 与 猫 交换 两 幅 图 像 的 相位 谱 
(2) 利用 频 域 滤波 消除 周期 噪声 


61 Д0 080—7) T HERIEU 
殊途同归 


在 很 多 情况 下 ， 频 率 域 滤波 和 空间 域 滤波 可 以 
视 为 对 于 同一 个 图 像 增强 问题 的 殊途同归 的 两 种 解 
决 廊 式 。 而 在 男 外 一 些 情况 下 ， 有 些 增 强 问 题 更 适 
合 在 频率 域 中 完成 ( 见 6.7 节 ) ， 有 些 则 更 适合 在 空 
站 域 中 完成 。 使 用 者 党 党 根据 雷 要 选择 是 工作 在 空 
间 域 还 是 频率 域 ， 并 在 必要 时 在 空间 域 和 频率 域 之 
间 相 互 转 换 。 


傅 里 时 变换 所 供 了 一 种 变换 到 频率 域 的 于 段 ， 
由 于 用 传 里 叶 变 换 表 示 的 函数 特征 可 以 完全 巡 过 传 
里 叶 反 变换 进行 章 建 ， 不 丢失 任何 信息 ， 因 此 它 可 
Ps 工时 不 丢失 
王 何 信息 。 


62 ” 传 里 叶 变 换 基 础 知识 


ЗИМЕ А, še enna ue БЕП L AH, 
必要 的 数学 知识 征 不 能 跳 过 的 ， 为 便于 理解 ， 本 而 
将 尽 可 能 定性 地 去 摘 述 。 其 实 傅 里 时 变换 所 必需 的 
数学 知识 对 于 一 个 理工 科大 二 以 上 的 学 生来 说 十 很 
有 限 的 ， 高 等 数学 中 傅 里 叶 级 数 的 知识 加 上 线形 代 
数 中 基 和 癌 量 空间 的 概念 束 在 够 了 。 下 面 束 从 一 维 
情况 下 的 傅 里 叶 级 数 开始 。 


6.2.1 傅 里 叶 级 数 

法 国 数学 家 全 里 叶 发 现任 何 周期 函数 只 要 活 四 
一 定 条 件 〈 狄 里 赫 利 条 件 ) ， 都 可 以 用 正弦 了 消 数 和 
TI RARE ARA, EAA AKH EME 
Z РА НУЛА RRR, Ja ERAR EAR. 

对 于 有 限定 义 域 的 非 周 期 疯 数 ， 可 以 对 其 进行 
周期 拓 延 从 而 使 其 在 整个 扩展 定义 域 上 为 周期 函 
数 ， 从 而 也 可 以 展开 为 傅 里 叶 级 数 。 
1. 傅 里 时 级 数 的 三 角形 式 

周期 为 T 的 函数 f(t ) 的 三 角形 式 健 里 叶 级 数 展 
FH: 


PS ci . | ; 1 
Кү = an (ap COS тул + br SIn палу) 
” 1 


(6-1) 


а = = = 27и А Пи =» A: РЁ ЗГ (x ) 的 频率 。 


ak 和 by 称 为 傅 里 叶 系 数 。 稍 后 在 学 习 侍 里 叶 弘 
数 的 复数 形式 时 还 将 介绍 侍 里 叶 系 数 的 另 一 种 形 
Ro 事实 上 ， 傅 里 叶 系 数 正 是 本 节 在 6.2.2 小 节 傅 里 
叶 变换 中 所 关心 的 对 象 。 


于 是 ， 周 期 函数 f(t ) 就 与 下 面 的 傅 里 叶 序列 产 
生 了 一 一 对 应 ， 即 


Ат) = { ao. (ау. bi), (аә, bo) ` } 
(6-2) 


图 6.1 形 象 地 显示 出 了 这 种 频 束 分 解 ， 左 侧 的 周 
期 函数 f(x ) 可 以 由 右 侧 通 数 的 加 权 和 来 表示 ， 妈 
由 不 同 频率 的 正 弛 和 余 强 录 数 以 人 不同 的 系数 组 合 在 
е. 


/\ 人 
| \ $ 


LA /1 \ А 
ү \ w. A 1 A A A h eA: hoa 
| À ka 傅立叶 分 解 ! \ | \ ТЕЕ Ж. ҮШ r... 
АКА Ооу l \ ra kal ua Тук 
E VA и V l| \ | 1313237 рага, 
Ж \ ү И | I ll ll ll || Vvy АМ 
\ I | ll WU lll àl \ 
\ V V ү, 
原始 函数 了 (x) 


其 傅立叶 展开 为 一 系列 不 同 频率 的 正 弦 、 余 强 函 数 的 加 权 和 


图 6.1 Р (хә 的 全 里 叶 分 解 


从 数学 上 已 经 证 明了 ， 传 里 叶 级 数 的 前 NN 项 和 
xE J ЖА (t) ТЕЗ ЖЕНЕШЕ К БЕЛЕШ: 


Е T 
hm 
М — ЁЛ А 0) 


fit) 一 йт = 0 


k=l 








© Р | i \ 
=; у ар сов kwgt + бр sin кы 





(6-3) 


多 6.2 为 旋 者 展示 了 对 于 一 个 方 疲 信 号 图 数 有 用 
不 同 的 N 值 的 逼近 情况 。 随 着 六 的 增 大 ， 通 近 效 果 
越 来 越 好 。 但 同时 也 注意 到 在 f(x ) 的 不 可 导 点 上 ， 
如 果 只 取 式 (6-1) 右边 的 无 穷 级 数 中 的 有 限 项 之 
和 作为 f(x) ， 那 么 jx) 在 这 些 点 上 会 有 起 伏 ， 对 于 图 
6.2 (а) 的 方 波 信号 尤为 明显 ， 这 束 是 阁 名 的 吉 布 
斯 现象 。 


| L 


(a) 方 波 信号 (b) N=5 


(c) N=30 (d) N=80 


图 6.2 采用 不 同 的 N 值 时 ， 傅 里 叶 级 数 展开 的 逼近 效果 
2. EIRA A JE AE IN 


际 上 和 面 介绍 的 三 角形 式 外 ， 仿 里 叶 级 数 还 有 其 
他 两 种 常用 的 表现 形式 ， 即 余弦 形式 和 复 指数 形 
式 。 信 助 欧 拉 公式 ， 上 述 3 种 形式 可 以 很 方便 地 进 
行 守 价 转化 ， 本 质 上 它们 部 是 一 样 的 。 


复 指 数 傅 里 叶 级 数 即 经 常 说 的 传 里 叶 级 数 的 复 
数 形式 ， 因 具有 人 简 涪 的 形式 只 十 一 个 统一 的 表达 
AIAR ERZO ， 在 进行 信号 和 系统 分 析 时 通 
单 虽 易于 使 用 。 而 余 强 传 里 叶 级 数 可 使 周期 信和 写 的 
幅度 说 和 相位 谱 的 意义 更 加 直观 ， 函 数 的 余 嘴 伟 里 
叶 级 数 展开 可 以 解释 为 fx ) 可 以 由 不 同 频 蒜 和 相位 


的 余弦 流 以 不 同系 数组 合 在 一 起 来 表示 ， 和 而 在 三 角 
形式 中 相位 是 隐 着 在 系数 an 和 bn 中 的 。 下 面 主要 
介绍 复 指数 传 里 叶 级 数 ， 在 后 面 的 传 里 叶 变 换 中 要 
用 到 的 正 是 这 种 形式 ， 关 于 余 骂 仿 里 叶 级 数 的 有 关 
千 识 ， 感 兴趣 的 读者 请 参考 本 草 附 录 ]I1。 


传 里 叶 级 数 的 复 指数 形式 为 : 


(6-4) 


(6-5) 


由 式 (6-4) 和 式 (6-5) 可 见 ， 复 指数 傅 里 叶 
级 效 形 却 比较 简 滞 ， 级 效 和 系数 都 可 以 采用 一 个 统 
一 的 公式 计算 。 有 关 如 何 由 式 (6-1) ИЕ E 
叶 级 数 复 指 数 形式 〈 式 〈6-4) ) 的 过 程 ， 由 于 这 
里 读者 感 兴 趣 的 并非 传 里 叶 级 数 本 里 ， 束 不 在 正文 
中 给 出 了 ， 详 细 的 内 容 可 参考 本 章 附 录 开 ， 只 要 旋 
者 相信 个 同 的 展开 形式 之 间 本 质 上 十 等 价 的 ， 并 对 
复 指 数 形式 的 传 里 叶 级 数 展开 建立 了 一 个 基本 的 形 
式 上 的 认识 束 在 以 继续 阅读 和 理解 后 面 的 内 容 了 了 。 


6.2.2 ” 傅 里 时 变换 
1. 一 维 连续 傅 里 时 变换 

对 于 定义 域 为 整个 时 间 轴 (ooo<t<%o) 的 非 周 
期 疯 数 f(t ) ， 此 时 已 无 法 通过 周期 折 延 将 其 扩展 
为 周期 函数 ， 这 种 情况 下 就 要 用 到 傅 里 叶 变 换 : 


s Ы) 
T. ' N ти: 
Fiu) = J firje “дт 
J> S 


(6-6) 
HF (u) н] B p EREMI f Ct 
) : 
Га) = | ruanan 
(6-7) 


式 (6-6) 和 式 (6-7) 即 为 通常 所 说 的 傅 里 叶 
ЛЕЙЛА, 6.17 P ЕИ) ЕМЕ ШЇ) ЖЕТ 
重建 正 是 基于 上面 的 傅 里 叶 变 换 对 。 


由 于 傅 里 时 变换 与 傅 里 时 级 数 涉 及 两 闫 不同 的 
函数 ， 在 很 多 数字 图 像 处 理 的 书 中 通常 对 它们 分 列 
进行 处 理 ， 并 没有 前 明 它 们 之 间 存 和 在 的 密切 联系 ， 


М #4Л^ т у ЮЛ, Зи EE ЛУТА У 
ЈА] ЯД РЁ АЈА Н Н] PUS a 99 №, ОАР E 
ПА ВК 18 Н 28 JE) o 


仔细 地 观察 式 (6-6) 和 式 (6-7) ， 对 比 复 指 
数 形式 的 全 里 叶 级 数 展开 公式 〈( 式 (6-4) ， 注 意 
到 在 这 里 傅 里 时 变换 的 结果 已 Cu) 实际 上 相当 于 傅 里 
叶 级 数 展 开 中 的 傅 里 叶 系 数 ， 而 反 释 换 公 式 (6- 
7) 则 体现 出 不 同 频 蒜 复 指数 函数 的 加 权 和 的 形 
式 ， 相 当 于 复 指 数 形 了 式 的 傅 里 叶 级 数 展开 公 陈 ， 只 
Лх Н и 杰 为 了 连续 的 ， 所 以 加 权 和 采用 
了 积分 的 形式 。 这 是 因为 随 看 作为 式 “6-5〉 的 积 
分 上 下限 的 工 回 整个 实数 定义 域 扩 展 ， 即 了 оо, 
Zu 则 趋 近 于 du (因为 u =WVT) ， 导 致 原来 离散 变 
化 的 u 的 连续 化 。 


2. 一 维 离散 傅 里 时 变换 


一 维 函 数 F(x ) (其 中 x =0, 1, 2 ,. ,M-1) КИ 
里 叶 变 换 的 离散 形式 为 : 


АМ 一] 
Е(и) = у ` Jaye TM u = 0,1,2,---,М-1 
г] 


(6-8) 
相应 的 有 反 变 换 为 : 


М—1 
f(z) = F pa Е(п)ет M r=0,1,2,--.M-—1 
u= 


(6-9) 


由 于 在 一 维 情 况 下 人 很 多 性 质 更 为 耳 观 ， 使 用 者 

育 睐 于 分 析 一 维 离 秘 伟 里 叶 变 换 ， 而 由 此 得 出 的 

这 些 结论 都 可 顺利 推广 至 二 维 。 一 些 有 用 的 性 质 如 
Te 


(1) 仔细 观察 式 (6-8) 和 式 (6-9) ， 注 意 到 
在 频率 域 下 变换 FF (u ) 也 是 离散 的 ， 且 其 定义 域 仍 为 
ОМ -1， 这 是 因为 F (u ) 的 周期 性 ， 即 : 


Flu + M) = Flu) 
(6-10) 


(2) IZA (6-9) ШУАМ, Ж H 1⁄2 
#24 E „ЛЕТА Z Г, З У ЕЕ АРЛА J X (6- 
8) 的 正 变 换 公 去 中 。 更 一 般 的 情况 是 只 要 能 够 剑 证 
正 变 换 与 反 变 换 之 前 的 系数 滋 积 为 VM 即 可 。 例 
ИП, ADARRA РАЗ Жу М, 


(3) 为 了 求 得 每 一 个 F (u) (u =0,1,2,..., М 
-1) ， 需 要 全 部 M 个 点 的 f (x ) 都 参与 加 权 求 和 计 
算 。 对 于 M ‘Du, MARMER Sm RIR. XF 
比较 大 的 M 《在 二 维 情 况 下 对 应 看 比较 六 的 图 


Ж), WARME, KERERE 
КОЖ HLI ЛЕТА ЖАЛ ЖАП e na VF EAE [PJ [E] 
题 。 


з. 二 维 连 续 传 里 叶 变 换 


有 了 之 前 的 基础 ， 下 面 将 傅 里 时 变换 及 其 反攻 
н та aa s 


Р i ‚г i TETE ` 
F(u. {! | = J J f | 工 ， үе йаки: "тау 
Jd — М — xl 


(6-11) 
类 似 地 ， 其 反 变 换 为 : 
(6-12) 


4. ФЕ АНАН EIE 


在 数字 图 像 处 理 中 ， 谈 者 关心 的 目 然 是 二 维 离 
散 函数 的 傅 里 时 变换 ， 下 面 百 接 给 出 二 维 离散 傅 里 
叶 杰 换 (Discrete Fourier Transform, DFT) 公 式 : 


M —1 N —]1 


Flu,v) = 5 | fir yje Ен 


г=0 y=0 
(6-13) 
| М—1 N—i О | 
f (T, y) = UN 2. š; Flu. 1 ) аек (иг / Ма-а N) 
(6-14) 


HEIFER (BAR) 的 变量 x у, XE 
Hu, v ESTRARRE ИДЕН ЛЕ E. |6] — 28: rH 
的 情况 相同 ， 由 于 频谱 的 周期 性 ， 式 (6-13) K% 
Хи IË (и=0,1,2,...‚ М-1) ку (у=0, 1, 2,..., N 
-1) 进行 计算 。 同 样 ， 系 数 1/MN 的 位 置 并 不 重 
要 ， 有 了 时 也 放 在 正 变 换 之 前 ， 有 了 时 则 在 正 变 换 和 反 
AS HR AI EJ HE DA AUV MN 。 


根据 式 (6-13) , ЖАКАУ E Н РАР 
为 : 


M —1 N—i 


F (0.0) = БЭ Б fiT. y) 
(6-15) 


显然 ， 这 是 f(x ,y ) 各 个 像素 的 灰 度 之 和 。 而 如 
果 将 系数 /MN 放 在 正 变 换 之 前 ， 则 FF (0, 0) 对 应 于 


原 图 像 f (x ,y ) 的 平均 灰 上 度 。F (0, OB ERREI 
Н) Ел (DC) 。 


本 书 之 前 曾 指出 了 一 维 函 数 可 以 表示 为 正弦 
(RIZ) 函数 的 加 权 和 和 形式。 类似 地 ， 二 维 函 数 f 
(x ,y ) 可 以 分 解 为 不 同 频 座 的 二 维 正 驼 〈 人 余弦 ) `F 
面 波 的 按 比例 县 加 。 图 6.3 (а) 中 给 出 了 一 幅 简 单 
的 图 像 ， 可 将 它 视 为 以 其 灰 度 值 作为 幅 值 的 二 维 也 
数 ， 如 图 6.3(b〉 所 示 ， 根 据 式 (6-13〉 ， 它 可 以 
分 解 为 如 图 6.3(c) 所 示 的 不 同 频 订 和 和 方 同 的 正 缀 
(CRIZ) 平面 波 的 控 比 例 闭 加 (只 给 出 了 一 部 
分 ) 。 比 如 图 6.3 (c) 中 第 一 行 中 间 的 平面 波 为 
sin(Y)， 而 第 二 行 右 面 的 平面 波 则 为 sin(X+27)， 而 
第 3 行 最 后 的 一 个 为 sin(2X+2Y )。 





100 0 
зо WW 500 
nem 300 
(a) 原 图 像 (b) 图 63 (a) 对 应 的 二 锥 函数 





q 595 
Се) ЕНЕ А ВУ ЖЕРД А [н] ЖЕЛП Л] Ip] BJ ПЕ 026 388 СТАЈЕ В > 


图 6.3 Ер у(х, у) УЕ 


6.2.3 ”幅度 语 、 相 位 详 和 功率 谱 


FB, Foko Y S РАР НОЕ A 


Ф 幅度 谱 : 
|F(u,u)| = [Re(u, v)? + Im(u,u)2]1/2 
(6-16) 
显然 ， 幅 度 谱 关 于 原点 具有 对 称 性 ， 即 


0) ш | < 


Ф JHM: 


Im{u, v) 
Ке{и, v) 





plu, v) = arc tan 
(6-17) 
ЛЕНА И, HJ AJF (u ,v ): 
F(u, v) = |F (u, v) jer) 
(6-18) 


Ф JZ RE): 


F Я f T u. f s m. Гу Я nh 
Piu, т) = |Р, в) = Reju, u)” + Im(u, uJ“ 


(6-19) 


其 中 : Re(u,v)#Hlm(u v ) 分 列 为 F (uw) 的 实 部 
和 虐 部 。 


幅度 谱 又 叫 频率 谱 ， 是 图 像 增强 中 关心 的 主要 
对 象 ， 频 率 域 下 每 一 点 (u ,v ) 的 幅度 |F (и, v) HK 
表示 该 频率 的 正弦 (余弦 ) 平面 波 在 蕉 加 中 所 占 的 
比例 ， 如 网 6.4 所 示 。 幅 度 谱 直接 反映 频率 信息 ， 是 
频率 域 滤 波 中 的 一 个 主要 依据 。 





图 6.4 ”幅度 谱 的 意义 


幅度 谱 中 的 A、B 、C、 СРЕ: H) J pU ВАА ЕЗИ 
在 的 加 权 求 和 中 的 权 值 〈 混 合 比例 ) 。 注 意 这 4 个 正弦 平面 波 的 方向 和 


相位 谐 表 面 上 看 并 不 那么 直观 ， 但 它 隐 仿 者 实 
部 与 虚 部 之 间 的 未 种 比例 关系 ， 因 此 与 图 像 结构 奶 
АЛ. 


由 于 对 于 和 空 = [Н] А: ААНД а x 间 下 的 每 一 
点 (u,v) ， 均 可 计算 ; 
у), Ао OMB ш ERARA sia Ma БУНИН 
W, 46.5 (b) 和 图 6.5〈c) 分 别 给 出 了 图 
6.5 (а) 中 图 像 的 幅度 谱 和 相位 E 获得 它们 的 方 
法 请 参考 6.3 世 中 傅 里 时 变换 实现 的 相关 内 容 ， 关 于 
幅度 谱 和 相位 说 的 一 个 非常 有 趣 的 例子 请 参考 例 
6.2. 








(a) 图 像 circuittif (b) 图 6.5 (a) 的 幅度 谱 с) 图 65 € (a) ттт 
注意 幅度 谱 关 于 原点 《图 像 中 心 ) 对 称 


图 6.5 ”circuit.tif 幅 度 к Ж, [ЮУ УИЛЛ AS CO, 
) 点 移 到 了 中 心 


6.24 АХ ҢУЗ hai 基 的 转换 


TRER EE, ARIER ENE 
换 ， 其 本 质 都 是 基 的 变换 。 下 面 首 先 一 起 回顾 一 下 
线性 代数 中 基 和 问 量 空间 的 相关 知识 。 


1， 基 和 问 量 空间 


ТЕ ЯЕ К арса [а] н, я аре 可 以 由 3 个 复 
(оо КЕ, л ЕР =( e), AINE 
ЗАЛЕ ҢА Eae HARR. ЗЕКЕ, Н 
序 集 {wm.w.w рул арно 的 3 个 标量 分 量 ， 也 就 是 系 
Ж; ТОЗА ЕЗ А ар (а. уи ЕК IÑ 2 
Ін] В [ау ш К а ЇН] уЗ [а Их УТУЕ Аа 
8], AEPA E [АЈ HP H жє Жун] 2231526 а д2 
性 组 合 〈 加 权 和 ) 表示 为 : 





U = 10121 + voca + V363 一 2 ТАЯ 
(6-20) 
АЈ ЕНЕ ЕУ 67 Z |]: 


(6-21) 


在 上 面 的 叙述 中 涉及 了 癌 量 的 正 交 ， 这 十 问 量 
代数 中 一 个 非常 重要 的 概念 。 为 了 说 明正 区 的 概 
念 ， 首 乞 回顾 一 下 回 量 点 积 《“ 数 量 积 ) , РАЈ 
的 点 积 定 义 为 : 


Т 
117 1 171 
Ч = || || соз 0 = urui+-uəouad-usua = [ш tz ug) | va | = | uo ну | = 
Ug U3 U3 


TAAT 


(6-22) 


HER, = vtot, Rn Es л, ө 为 
8, 和 和 # 之 间 的 夹 朋 ， 上 标 T 表 示 转 置 。 


此 时 ， ИЦ ш.#—=0, 则 称 这 两 个 同 量 а Jz 互相 
IEZ 。 由 式 (6-22) 可 知 ， 两 非 零 癌 量 正 交 则 
сов@ =) s Wm HH H. 35 790° СЕН) о 

E Ж, ж х— inj Е 5) [== J [ај HJ 
投影 或 分 量 为 : 


;在 z 方向 上 的 投影 (分量 ) = “而 © 


其 中 : 为 同 量 :时 位 化 后 的 时 位 同 量 ， 模 为 
1， 方 同 与 z 相同 。 


IN (6-23) WUA m fa PR EEEN 
HEDE, Ат И AA E a E 7 Ар rn] ar 
HI RER o 


96.6821 EDE ЖИЕ БУК ру, 46.6 (a) 
中 为 一 个 三 维 空间 中 的 向 量 * 以 及 3 个 单位 正 交 基 
[п] Ër EL ра. €s s 66.6 (b) HH [Ае E > 7 
器 的 投影 o; ТЕ 6.6 (c) 中 ， 根 据 矢量 加 法 的 平 
ITAA, E s ЕЕ УЗА ЕА аја, 
5 、 忆 的 线性 组 合 ， 显 然 可 以 表示 为 ?二 (0.w. ) 的 形 


тү" 





(a) ШЗ ЕЖЕН] е, é, её, (b) B]#rv/Eé) IJ BJPpz sv 





V3 ез 


6.6 = JL H 48 Z= н) [п] кн EE 


£ арн (и БИНО ЖМ 维 
可 量 空 间 。 任 何 一 个 该 空间 中 的 N x1 同 量 均 可 由 N 
М јаја 二 二 :人 的 线性 组 合 来 表示 ， 记 作 : 


№ 


= 》 vë 


є—1 


(6-24) 
EP, DE «NAE е ТЕ & NARR: 
(6-25) 


zÑ (6-24) 称 为 对 MEJ, I1 (6-25) 称 为 对 
г ӨЙ» 


ШШ 个 单位 其 癌 量 之 间 满 在 两 两 正 交 关系 ， 


(6-26) 
2. РЁ Z #H РА 2% [B] 


Е EEEE 5 E ҢА БИ PE hili, 

me 与 傅 里 叶 变 换 与 反 变 换 之 间 的 关系 却 十 分 紧 
。 事 实 上 ， 它 们 在 形式 上 有 大 惊人 的 相似 ， 唯 一 
不 癌 的 是 这 里 的 向 量 空间 变 成 了 了 二 х |н], аја е 
АРИ, Г РА (х), П Ја... z, 也 相应 地 变 成 了 
EAZ. ЕКЕ (6-24) 一 式 (6-25) 和 式 (6-8) 
一 式 《6-9) 的 形式 不 难看 出 ， 式 《6-24) 的 分 解 过 


ВОЛН SFR EIRE, M C6-25) 的 重 爸 过 程 
则 恰恰 相当 于 傅 里 时 反 变 换 。 也 束 是 说 ， 相 应 函数 
空间 中 的 任 晶 函 数 艾 可 以 由 充 函 数 空 间 中 的 一 组 基 
图 数 的 加 权 和 来 表示 。 观 察 式 〈6-8) 容易 有 友 现 ， 
X [Р] ЕРА 0892 усет, Н КНЈАЗ А ЖЛ 
图 数 的 正 交 性 : 


(6-27) 


至 此 ， 读 者 应 该 已 经 理解 了 傅 里 时 变换 的 实质 
一 一 其 的 转换 。 对 于 给 定 函 数 f(x )， 关 键 是 选择 合 
适 的 基 ， 使 得 f(x ) 在 这 组 基 下 ， 表 现 出 使 用 者 需要 
的 特性 ， 当 某 一 组 基 不 潢 中 要 求 时 ， 束 需要 通过 变 
换 将 函数 转换 到 男 一 组 基 下 表示 ， 方 可 得 到 使 用 者 
需要 的 函数 表示 。 第 用 的 变换 有 傅 里 时 变 搞 〈 以 正 
ZMR 5% РА УЕ РА) 、 小 波 变换 (以 各 种 小 波 
图 数 为 基 图 数 ) „ ARIE pÀ 2 Walsh H 
S, эрк Е, ТЕВЗ1З® PAH, ЖЕВАЛ 
к лин кеи асан нн 


28; 


央 速 传 里 叶 变 换 太 实现 


6.2 方 介绍 了 离散 健 里 叶 变 换 СОЕТ) WEH, 


0.3 


但 并 没有 涉及 其 实现 问题 ， 这 主要 是 因为 DFT 的 直 
接 实 现 效 率 较 低 。 在 工程 实践 中 ， 迫 切 地 需要 一 种 
НЕ? ОЖ ТИ ТАНАУ EIER е 99725, ТОШ 
里 时 变换 (Fast Fourier Transform, FFT) 便 应 运 而 
生 。 丁 将 给 出 局 速 傅 里 叶 变 换算 法 的 原理 及 其 实 
277. 


6.3.1 FETH BJ P: 22 PE 


之 所 以 提出 快速 传 里 时 变换 (FFT) 27715, = 
因为 在 计算 离散 域 上 的 傅 里 时 变换 时 ， 对 于 扣 厅 
列 ， 它 的 DFT 变换 与 反 变 换 对 定义 为 : 


№-1 А 
т=0 


\ М—1 
(т) = + У FWy, r=0,1,..…,N—1 
и=0 
(6-28) 


于 是 不 难 发 现 ， 计 算 每 个 u 值 对 应 的 F (u ) 需 要 
N 次 复数 乘法 和 N -1 次 复数 加 法 ， 因 此 ， 为 了 计算 
长 度 为 N 的 序列 的 快速 全 里 叶 变 换 ， 共 需要 执行 N“ 
次 复数 乘法 和 N (N -1 次 复数 加 法 。 而 实现 1 次 复数 
相 加 至少 需要 执行 2 次 实数 加 和 法， 执行 1 次 复数 相 乘 
则 可 能 需要 至 多 4 次 实数 来 法 和 2 次 实数 加 法 。 如 末 
使 用 这 样 的 算法 直接 处 理 图 像 数 据 ， 运 算 量 会 大 得 


惊人 ， 喝 无 法 实现 实时 处 理 。 


然而 ， 离 散 健 里 叶 变 换 的 计算 实质 并 没有 那么 
复杂 。 在 离散 傅 里 时 变换 的 运算 中 有 大 量 重 复 运 
算 。 上 面 的 变量 WN 是 一 个 复 变 量 ， 但 是 可 以 看 出 
它 具 有 一 定 的 周期 性 ， 实 际 上 它 只 有 NN 个 独立 的 
值 。 而 这 六 个 值 也 不 是 完全 相互 独立 ， 它 们 又 具有 
一 定 的 对 称 关 系 。 关 于 变量 Www 的 周期 性 和 对 称 性 
可 以 做 如 下 总 结 : 


И = Мз 1 
(6-29) 
ИЕ И p ш ил 
(6-30) 


zÑ (6-29) 是 W ERER IA MIERE, ШШ 
т\\ (6-30) ШУНУН УМ Jú ж) ЯЕ ХУК 
性 。 利 用 W 的 周期 性 ，DFT 运 算 中 的 某 些 项 就 可 以 
合并 ; 而 利用 W 的 对 称 性 ， 则 可 以 仅 计 算 半 个 W 序 
列 。 而 根据 这 两 点 ， 束 可 以 将 一 个 长 度 为 N 的 序列 
分 解 成 两 个 长 度 为 N/2 的 序列 并 分 别 计 算 DFT， 这 
样 束 能 可 以 节省 大 量 的 运算 量 。 本 书 将 在 讲述 常见 
HJFFT 算 法 后 分 析 太 和 省 的 运算 量 。 


这 正 是 快速 伟 里 叶 变 换 的 基本 思路 一 一 通过 


4 
较 长 的 序列 转换 成 相对 短 得 多 的 序列 来 大 大 减少 运 


ZA ЕЯ 


FE o 
6.3.2 ” 钊 见 的 FFT 算 法 


目前 流行 的 大 多 数 成 浆 的 FFT 算 法 的 基本 思路 
大 致 可 以 分 为 两 大 类 ， 一 燃 是 投 时 间 抽 取 的 快速 傅 
里 叶 算 法 (Decimation In Time, DIT-FFT) ， 另 一 
类 是 按 频 深 抽 取 的 快速 健 里 叶 算 法 (Decimation In 
Егедепсу, DIF-FFT) 。 这 两 种 算法 思路 的 基本 区 别 
如 下 。 


按时 间 抽 取 的 FFT 算 法 是 基 于 将 输入 序列 Fx ) 
ЛЯ GHPO 成 较 短 的 序列 ， 然 后 从 这 些 序列 的 
DFT 中 求 得 葵 入 序列 的 F (и ) 的 方法 。 由 于 抽取 后 的 
较 短 序列 仍然 可 分 ， 所 以 最 终 仅 仅 需 要 计算 一 个 很 
得 的 序列 的 DFT。 在 这 种 算法 中 ， 主 要 关注 的 征 当 
序列 的 长 度 是 2 的 整数 次 蜂 时 ， 如 何 能 够 局 效 地 进 
行 抽取 和 运算 的 方法 。 


而 近 频 率 抽 取 的 FFET 算 法 征 基 于 将 输出 序列 F 
(и) GHPO 成 较 短 的 序列 ， 并 且 从 fx ) 计 算 
这 些 分 解 后 的 序列 的 DFT。 同 样 ， 这 些 序列 可 以 继 
续 分 解 下 去 ， 继 续 得 到 更 短 的 序列 ， 从 而 可 以 更 倍 
便 地 进行 运算 。 这 种 算法 同样 定 主要 针对 2 的 整数 


KERKE HIF ЈЕУ 


从 本 章 前 面 对 DFT 的 介绍 和 本 节 开 头 的 分 析 可 
知 ， 随 着 序列 长 度 的 减 小 ，FFT 运 算 的 复杂 度 将 以 
指数 规律 降低 ， 


本 市 主要 讨论 厅 列 长 上 度 是 2 的 整数 次 共 时 的 
DFT 运算 ， 这 称 为 基 -2 FFT。 除 了 基 -2FFT， 还 有 
基 -4FFT 和 基 -8FFT， 甚 至 还 有 基 -6FFT。 那 些 算 法 
的 效率 比 基 -2FFT 更 高 ， 但 应 用 的 范围 更 狭 军 。 事 
实 上 ， 人 很 多 了 商业 化 的 信号 分 析 库 都 是 使 用 混合 基 
ЕЕТЕЈ. ЭЖ ЕШ ЛЕЛЕ NIB E JE 28, TH W 4545 
多 ， 而 且 应 用 范围 更 广 。 本 书 从 学 习 和 研究 的 角 
上 度 ， 仅 介绍 最 各 见 的 按时 间 抽 取 的 基 -2 FFT 算 法 。 


6.3.3 ”按时 间 抽 取 的 基 -2 FET 算 法 


对 于 基 -2 FFT， 可 以 设 序列 长 度 为 N=2“ 。 由 
ТМ 十 俩 数 ， 可 将 这 个 序列 控 照 项 数 的 可 个 分 成 两 
组 。 分 组 的 规 侍 如 下 却 所 示 : 


| (2х) = ја (0) ` КИН: 
| Ох+1) s=. f; ar” ={ 1. “А ла. 


(6-31) 


则 f(x ) 的 傅 里 叶 变 换 F (u ) 可 以 表示 为 f(x ) 的 奇 


AORAR AMIA zH РАЧА ТНА F 323920: 


М-1 
пишу ў ДООР => рун ау [бг 
х=й 


-一 :个 N шый 


(6-32) 
2—1 е. | 
= > f(2r)W i ч + > f(r + 1)Wy t r = 0,1,2, > -1 

(6-33) 

2—1 x] 

Fiu) 2 У Ў(2г) И гиа ү "a > f (2r ү Ит" 

r=0 "0 i 

(6-34) 


容 多 及 现 ， 上 陈 的 第 一 项 为 FCr ) 的 N /2 点 
DFT， 而 第 二 项 的 求 和 部 分 为 f(2r +1) 的 N /2 sË 
ОЕТ 序列 f (2r ) 利 序列 f r +1) 的 周期 均 为 N 
/2) > tHEJ: 


F(u)= Е. (и) + Wy F, (u), u =0,1,2,--: е. 


w 


(6-35) 


XE, HF a (u )#IF = (u ) 分 别 表 示 f (2r ) 和 f 
(2r +1) 的 N /2 点 DFT。 


而 且 ， 根 据 DFT 序 列 的 周期 性 特点 ， 还 可 得 到 
如 下 去 的 成 立 : 


| N | N 
Е, (и) = F, (u + 5) F, U) Fpp (u + >! 


(6-36) 
并 且 ， 由 于 mw = 1, ЖаН: 
Wata ИИ = aa 
(6-37) 
因此 ， 
Рр (и+ =) =F, (u) 
(6-38 ) 


将 式 (6-36) 和 式 (6.37) 代入 式 (6-38) , 
并 根据 式 (6-35) ， 得 : 


| (и) = Fa(u)+W, Fat) u =0,1,72,---, = —1 


т АГ 
м H= | Г N 
| F (u r.) = Р. (ш) +W. ° Fa (u + 二 = Р. (н) Wa ЈА (u) u = 0,12. - сш. 


С 6-39) 


这 是 一 个 递 推 公式 ， 它 束 是 FFT 蝶 形 运 算 的 理 
К. ZARR, MAAKE АЧИ E 
ДЕЙН] РДАН НУ А С 28 S ЕН HT 2 a 45 
51], тшн] РА АЛЛ ЭЛ БЕРУИ Л ЭУ ЛИ ЭТ ЧЖ 
公式 相 加 / 相 减 ， 而 在 这 个 运算 过 程 中 ， 实 际 上 只 需 
要 计算 WNu ，u =0,1,2,3,..., N /2-1。 


对 此 ， 一 个 8 点 按时 间 抽 取 的 FFT 算 法 的 第 一 步 
又 .如 图 6.7 所 示 。 


С (O) 


W 
FAD @ 4 点 & 49) Е (1) 
га O Ф O Е (2) 
、 
(6) Ó @ | | yU) F (3) 
і СС УС >< ка) 
ка O G Q ç N & А < KA 
3 = Ив! 
f <5) CJ € O F (6) 
FD C Ф >) Е (7) 





И =W 
图 6.7 “8 点 FFT 变 换 简 图 


图 6.7 是 根据 式 〈6-39) 绘制 的 ， 这 一 算法 也 可 


以 用 图 6.8 抽 象 地 表示 出 来 。 

F С) — 一 @ F +W. F, 
“ -一 人 

n O O O FPWR, 


图 6.8” 暴 形 算法 抽象 示意 图 


由 于 讨论 的 是 基 -2FFT 算 法 ，N /2 一 般 应 是 偶 


数 ， 因 此 得 到 的 序列 还 可 以 继续 分 解 ， 分 解 过 程 可 
以 一 且 持 续 到 每 个 友 列 只 需要 2 点 的 DFT。 这 样 只 

希 要 如 下 的 运算 即 可 计算 这 一 DFT 值 ， 这 一 运算 是 
FFT 的 基本 运算 ， 称 为 蝶 形 运算 。 屿 形 运 算 的 基础 
单元 示意 图 如 图 6.9 所 示 。 


f (0) I 
F (0) =f (0) +Wyf (1) =f (0) +f (1) 


fa) FW =r ИО Sr (О р) 
=] 


6.9 АА Л 


这 一 基础 单元 是 对 初始 输入 序列 进行 健 里 叶 变 
换 操作 的 第 一 步 ， 即 两 点 时 的 FFT。 把 这 个 基本 的 
DFT 运 算 和 上 面 的 抽象 化 蝶 形 运算 比较 ， 可 以 发 现 
它们 的 基本 结构 是 完全 一 致 的 。 在 蝶 形 算法 中 ， 可 
以 只 计算 一 次 WE o 而 后 分 别 与 F 1 相 加 和 相 减 ， 
从 而 每 一 次 蝶 形 算法 只 需 1 次 复数 乘法 和 2 次 复数 加 
法 (从 复杂 度 分 析 的 角度 ， 相 减 当 然 也 可 看 作 是 一 
次 加 法 ) 。 并 且 ， 注 意 到 Ww =1， 因 此 可 以 进一步 
简化 计算 。 尤 其 第 一 级 蝶 形 运算 更 是 可 以 完全 简化 
为 单纯 的 复数 加 减法 。 


一 个 8 点 FFT 的 完整 计算 过 程 如 图 6.10 所 示 ， 请 
思考 这 个 过 程 与 DFT 过 程 的 区 别 ， 以 及 这 个 过 程 所 


m WJ PLA REMETE. НЛА K [ГИ 
ЫГА 
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6.10 ”8 点 FFT 算 法 


用 基 -2 的 时 间 抽 取 FFT 算 法 比 直 接 计算 DFT 的 
效率 局 得 多 


。 在 计算 长 度 为 N=2 “序列 的 FFT 时 ， 


在 不 对 复数 乘法 进 行 额 外 优化 的 情况 下 ， 所 和 需 运算 
量 分 析 如 下 。 


对 于 每 一 个 蝶 形 运算 ， 需 要 进行 1 次 复数 乘法 


和 2 次 复数 加 法 。 而 FFT 运 算 的 每 一 级 都 含有 N /2 = 
2° 二 个 蝶 形 运算 单元 。 因 此 ， 完 成 L 级 FFT 运 算 共 
需要 的 复数 乘法 次 数 M_， 和 复数 加 法 Mo 数 үе | 


(6-40) 
Ma = LN = Мов, 
(6-41) 


MATAR, З АЈРЕС Р 1 DFT1e 


算 则 需要 N 2 次 复数 乘法 和 N (N -1) 次 复数 加 法 ， 这 
远 远 多 出 FFT 算 法 的 所 需 。 近 似 比较 FFT 和 DFT 运 


算 的 算法 复杂 上 度 可 知 : 


CN) = _ а 
iY, Nlo Eo N jo gN 
(6-42) 
或 
Б JL 
C = == 
27 T 
(6-43) 


КК, ТЕМ 或 L 取 值 增 大 时 ，FFT 运 算 的 优势 


更 加 明显 。 例 如 ， 当 N=2109 时 ，C(N )=102.4， 即 

FFT 算 法 的 速度 是 DFT 的 102.4 傍 。 
此 外 ， 从 占用 的 存储 空间 看 ， 按 时 间 抽 取 的 

FFT 竺 法 也 远 比 DFT 竺 法 节约 。 一 对 复数 进行 完 蝶 


形 运 算 后 ， 就 没有 必要 再 次 保留 输入 的 复数 对 。 因 
此 ， 输 出 对 可 以 和 输入 对 放 在 相同 的 存储 单元 中 。 
所 以 ， 只 需要 和 输入 序列 大 小 相等 的 存储 单元 即 

可 。 也 就 是 一 种 < 原 位 ?运算 。 


但 是 ， 经 过 观察 上 面 的 8 点 FFT 运 算 全 过 程 ， 可 
以 及 现 ， 如 各 要 使 用 这 种 “ 原 位 >? 运算， 输入 厅 列 职 
必须 按照 倒序 存储 。 由 于 f(x ) 是 逐次 抽取 的 ， 所 以 
必须 对 原 输 入 码 列 倒转 位 序 ， 得 到 的 次 序 相 当 于 是 
原 序 列 编 亏 的 二 进 制 但 位 倒置 。 也 即将 原 序 列 编 扎 
JOHR, HEH ERA A MARSTEN 
IJ, WIER / ТЕЗЕБК ТИ АЛ 1218 H AET 
位 置 。 下 面 同 样 以 8 点 FET 为 例 说 明码 位 倒置 的 方 
法 ， 如 表 6.1 所 示 为 8 点 FFT 的 人 码 位 倒置 对 应 表 。 


表 6.1 8 点 FFT 的 公 位 倒置 对 应 表 














按照 表 6.1 中 的 顺序 排列 输入 数据 ， 束 可 以 方便 
地 进行 原 位 运算 ， 以 贡 约 内 存 空 间 了 。 
6.3.4 ”离散 反 健 里 时 变换 的 快速 算法 


离散 反 傅 里 时 变换 (Inverse Discrete Fourier 
Transform, IDFT) WEAS BA EMERARA 


似 ， 首 先 比 较 它 们 的 公式 形式 。 
离散 反 傅 里 时 变换 (ТОЕТ) 的 公式 为 : 
f(z) = IDFT(F(0) = ЭЗ F(W Wi™ 
(6-44) 
离散 傅 里 叶 变 换 (DFT) 的 公式 为 : 
F(u) = DFT(f(z)) = > Jawy 


(6-45) 


观察 式 (6-44) 和 式 (6-45) 发 现 ， 只 要 把 
DFT 算 子 中 的 Www Ч Wy ux, E R ДУЛ 
， 即 可 得 到 IDFT 的 算 子 。 于 是 考虑 使 用 复数 共 斩 方 
式 建 立 两 者 之 间 的 联系 ， 推 导 离 散 反 傅 里 时 变换 的 
公式 如 下 : 


N —1 


ео 1 НОР | 1 р 
fz) = т^, Ки) у" | = y IDFT|F' (u)]]' 
O usi 1% 


(6-46) 


因此 ， 只 需 先 将 (и) ИЖ, ЈЕ А209: 
用 DFT 算法 计算 IDFT 了。 


6.3.5 N 维 快 速 傅 里 时 变换 


N 维 快速 传 里 时 变换 (FFTN ) 用 于 对 高 维 信 
号 炬 阵 执 行 信里 叶 频 谐 分 析 操 作 。 其 中 二 维 的 似 速 
傅 里 叶 变 换 向 第 用 于 数 子 图像 处 理 。 


N 维 快速 傅 里 时 变换 是 由 一 维 FFT 组 合 而 成 
的 ， 其 运算 的 实质 就 是 在 给 定 二 维 或 多 维 数组 的 每 
个 维度 上 依次 执行 一 维 FFT， 并 且 使 用 “ 原 位 ”运算 
的 方法 。 在 开始 之 前 ， 算 法 将 输入 直接 复制 到 输出 
上 ， 上 所 以 之 后 在 每 个 维度 上 执行 FFET 的 原 位 操作 都 
不 会 改变 原本 的 输入 数组 ， 同 时 也 使 这 个 算法 输出 


НУ АН 138 Л. НУ 92 3 ТАЗЕ АЧТА Е {ШЙ 
де, WRX а К RAAT ЯЕ Е E HA 
换 操 作 ， 得 到 的 结果 也 将 是 一 个 二 维 数组 ， 


和 梢 后 将 在 本 节 的 Visual C++ 实现 中 给 出 二 维 快 
速 傅 里 时 变换 算法 的 实现 细节 。 


6.3.6 MATLAB 实 现 


MATLAB 中 提供 了 fft20 和 ifft20 函 数 分 别 计 算 
二 维 傅 里 时 变换 和 反 变 换 ， 它 们 都 经 过 了 优化 ， 运 
算 速 度 非 常 快 。 另 一 个 与 傅 里 时 变换 答 切 相关 的 郴 
ЖЕШИН), Жтт ЖЧ Ж ЕЛ НУ ЕН 
的 零 频 点 移动 到 频谱 图 的 中 心 位 置 。 


下 面 分 别 介绍 这 3 个 函数 。 
1. fft20 2 


РН FARATZ ERR НЕЕ, КЕШЕП] 
以 耻 接 用 于 数字 图 像 处 理 。 调 用 语法 如 下 。 


fft2(X) 
fft2(X,m,n) 


参数 说 明 : 


° X 为 输入 图 像 ， 

° m Хп 分 别 用 于 将 和 的 第 一 和 第 二 维 规整 到 指定 
的 长 度 ， 当 mm Mn 均 为 2 的 整数 次 蝴 时 算法 的 执 
行 速度 要 比 m 和 n 均 为 素数 时 更 快 。 


返回 值 : 
o 了 征 计算 得 到 的 传 里 时 频 谐 ， 古 一 个 复数 矩阵 。 


计算 abs(Y) 可 得 到 幅度 谱 ， 计 算 angle(Y) 可 得 到 相位 谱 。 
2. fftshift() EK Ж 

ТЕРС () PR ЖЕН УЖИН, хе Ja 
ВТРАТ НЛ А НЕЕ HJ, Т РАЖИ У 
uU KE, АЈА Y АДЕ АТУ АЕ РЕН 
E, АЕТ РИ RN AAN ERE R ma И 
( 零 频 处 的 幅 值 较 高 ) ， 如 图 6.11 (а) 所 示 。 

fftshiftO 函 数 利 用 了 频谱 的 周期 性 特点 ， 将 输 
出 图 像 的 一 半 平 移 到 为 一 颖 ， 从 而 使 零 频 仆 移 动 到 
图 像 的 中 间 ， 如 图 6.11 (b) 所 示 。 


其 调用 语法 如 下 。 


Y = fftshift(X) | 


` = fftshift(X,dim) 





ПТ, 
% 





(a) 未 经 过 平移 的 幅度 谱 (b) 经 过 平移 的 幅度 谱 
6.11 频谱 的 平移 

参数 说 明 : 

° X 为 要 平移 的 频 详 ; 

e dim 指出 了 在 多 维 数组 的 哪个 维度 上 执行 平移 操 
Е. 
j ИЕ: 

。 了 是 经 过 平移 的 频谱 。 


利用 fftshiftO 函 数 对 图 6.11 (а) 中 的 图 像 平移 


后 的 效果 如 图 6.11 (b) 所 示 。 


下 面 给 出 对 于 二 维 图 像 算 阵 ，fftshiftO 函 数 的 
平移 过 程 ， 如 图 6.12 所 示 。 


可 见 ， 输 出 矩阵 被 分 为 了 4 个 部 分 ， 其 中 1、3 
两 部 分 对 换 ，2、4 两 部 分 对 的 ， 这 样 ， 原 来 在 角 上 
的 零 频 率 点 〈 原 点 ) 位 置 就 移动 到 了 图 像 的 中 央 位 
置 。 而 dim 参数 则 可 以 指定 在 多 维 数组 的 哪个 维 虔 
上 执行 对 换 操 作 。 例 如 ， 对 于 算 阵 而 言 ，dim 取 1 和 
2 的 情形 分 别 如 图 6.13 所 示 。 





图 6.12  fftshiftO PK XT — AEE ЕДЕ 


For дит = 1: For dim = 2: 





图 6.13 fftshiftO 函 数 对 二 维 抢 阵 的 平移 过 程 细 节 分 析 
3. ifft20 函 数 
该 图 数 用 于 对 图 像 〈 窍 阵 ) ITÉ HIH ЖЕ 


Hho HEERE ADS E E. VH EAn 
Te 


Y = ifft2(X) 
Y = ifft2(X,m,n) 


参数 说 明 : 


° X 为 要 计算 反 变 换 的 频 谐 ; 
° т. n 的 意义 与 fft20 中 相同 。 


返回 值 : 


。 了 是 肥 变 换 后 得 到 的 原始 图 像 。 
注意 


在 执行 ifft20) 函 数 之 前 ， 如 果 曾 经 使 用 fftshiftO 函 数 对 频 域 图 像 进 
行 过 原点 平移 ， 则 还 需要 使 用 ifftshift0 将 原点 平移 回 原 位 置 。 


【 例 6.1】 幅度 详 的 意义 示例 。 


下 面 交 程 厅 展 未 了 如 何 利用 fft20 进 行 一 维 快速 
傅 里 时 变换 。 为 了 更 好 地 显示 频谱 图 像 ， 需 要 利用 
3.3 方 中 学 习 过 的 对 数 变 换 来 增强 频谱 。 相 关 的 代码 
ад К. 


11 = imread('cell.tif'); % 读 入 原 图 像 


fcoef = fft2(I1); % 做 fft 变 换 
spectrum = fftshift(fcoef); % 将 零点 移 到 中 心 


temp =log(1+abs(spectrum)); % 对 幅 值 做 对 数 变 换 以 压缩 动态 范 


subplot(1,2,1); 
imshow(temp,[]); 
title('FFT'); 
subplot(1,2,2); 
imshow( I1); 
title('Source') 


I2 = imread('circuit.tif'); ЛА 


fcoef = fft2(I2); % 做 fft 变 换 
spectrum = fftshift(fcoef); % 将 零点 移 到 中 心 


temp =log(1+abs(spectrum)); % 对 幅 值 做 对 数 变 换 以 压缩 动态 范 


figure; 
subplot(1,2,1); 
imshow(temp,[]); 
title('FFT'); 
subplot(1,2,2); 
imshow( I2); 
title('Source') 





上 述 程序 的 运行 结果 如 图 6.14 所 示 。 


可 以 看 出 ， 图 6.14 (b) 中 的 cell.tif 图 像 较为 平 
滑 ， 而 在 其 傅 里 时 频谱 中 ， 低 频 部 分 对 应 的 幅 值 较 
大 ; 而 对 图 6.14 (а) 中 细节 复杂 的 的 图 像 
circuit.tif， 灰 虚 的 变化 趋势 更 加 剧烈 ， 相 应 的 频谱 
中 高 频 分 量 较量 。 


事实 上 ， 由 于 网 6.14 (d) 图 中 基本 只 存在 水 平 
和 垂 吾 的 线条 ， 导 致 了 在 输出 的 频谱 中 胸 线 集中 存 
ГКР Н 210) GHANA) „ АИД 
Тл, JEENA P AKFAR M Toi Р НВ Е 
Zk, ТО Е Ze XF A la НЬ УКР ЛУ ЛХ 
ОВЕ, KED ТАА n] РАЯ ТЕТЕ! EL E 
JK Bs КН, ПОСЕ НУЛЕ J kuti n] ЕД 
АА АА ЈЕР 8196 J ee JI, A 
MARR PEETA; MAFREN HJ JZ, 


ПА хе И НУ 


退 过 例 6.1， 可 以 友 现 一 些 频 谱 与 其 空间 域 图 像 
之 加 的 联系 。 实 际 上 ， 低 频 ( 频 详 图 像 中 菲 近 中 心 
的 区 域 〉》 对 应 看 图 像 的 慢 变 化 分 量 ; түй СОЛУ 
像 中 远离 中 心 的 区 域 ) 对 应 看 一 幅 图 像 中 较 快 变化 
的 艾 度 级 ， 利 帅 对 应 看 图 像 细 下 ， 如 物体 的 边 绿 和 
RES. MERG (d) 的 电路 图 像 来 说 ， 电 路 板 
的 灰 度 较为 一 致 的 至 景区 域 束 对 应 看 频谱 的 低频 部 
分 ， 而 模 坚 电路 线条 的 灰 度 变换 则 是 相对 融 频 的 成 
分 ， 且 灰 肥 变换 越剧 烈 ， 束 对 应 看 越 蜗 的 频 域 分 





46.14 ”图 像 及 其 幅度 谱 


在 6.2.3 小 厄 曾 给 出 了 幅 度 谱 和 相位 谱 的 定义 并 
对 其 作用 进行 了 简单 的 介绍 ， 为 了 进一步 加 深 读者 
对 幅度 谱 和 相位 谱 的 认识 ， 这 里 给 出 一 个 天 于 它们 
的 有 趣 的 例子 。 


【 例 6.2】 美女 与 猛 一 一 交换 两 幅 图 像 的 相位 


р. 


6.15 (а) 、 (b) 中 分 别 是 一 张 美女 的 照搬 
和 一 张狂 的 照片 ， 这 里 准备 交换 这 两 幅 图 像 的 相位 
谱 ， 即 用 美女 的 幅度 谱 加 上 猫 的 相位 谱 ， 而 用 猫 的 
幅度 谱 加 上 美女 的 相位 谱 ， 然 后 根据 式 (6-18), 
通过 幅度 谱 和 相位 谱 来 还 原 傅 里 时 变换 FE(u,v)， 再 
经 傅 里 叶 反 变换 得 到 交叉 相位 谱 之 后 的 图 像 。 根 据 
6.2.2 中 关于 幅度 谱 和 相位 谱 各 自作 用 的 讨论 ， 读 者 
A 
Ш 


imread('beauty.jpg'); 
imread('cat.jpg'); 


% K 33 
Af = fft2(A); 
Bf = fft2(B); 


% TARIE AA 


AfA = abs(Af); 
AfB = angle(Af); 
BfA = abs(Bf); 
BfB = angle(Bf); 


% ЛНАУ E E Н Е 
AfR = AfA .* cos(BfB) + AfA .* sin(BfB) .* i; 


BfR = BfA .* cos(AfB) + BfA .* sin(AfB) .* i 


% 傅 里 时 反 变 换 
AR = abs(ifft2(AfR)); 
BR = abs(ifft2(BfR)); 


% 显示 图 像 
subplot(2,2,1); 
imshow(A); 


title(' 美 女 原 图 像 ' ) ; 


subplot(2,2,2); 
imshow(B); 


title(' 独 的 原 图 像 ')，; 


subplot(2,2,3); 
imshow(AR, []); 
title(' 美 女 的 幅度 详 和 猫 的 相位 谱 组 合 ' ); 


subplot(2,2,4); 
imshow(BR, 


[]); 
1ї1е('ЖШЛИ ЛЕЛИ ЈАНИ"); 


u 程序 运行 结果 如 图 6.15 (с) ЯП 6.15 
示 。 


(d) 所 





(a) 美女 图 像 (b) 猫 的 图 像 





(с) 美女 幅度 谱 加 上 猫 的 相位 谱 (d) 猫 的 幅度 谱 加 上 美女 的 相位 谱 
46.15 ”幅度 谱 与 相位 谱 的 天 系 


通过 这 个 示例 ， 可 以 发 现 ， 交 换 相 位 谱 之 后 ， 
反 变 换 之 后 得 到 的 图 像 内 容 与 其 相位 谱 对 应 的 图 像 
Ж, ЕЕ S Z ВЭ ГАНА е 4182 АЩ 
论断 。 而 图 像 中 整体 灰 度 分 布 的 特性 ， 如 明暗 、 灰 
度 变 化 趋势 等 则 在 比较 大 的 程度 上 取决 于 对 应 的 凡 
БЕ, [| ЖЇН БЕ КАШ Г КИЙ ЛЖ ЕКЕЖ ЛЛ ГА НАД 
率 分 量 的 相对 强度 。 


6.3.7 Visual C++ 实现 


根据 6.3.5 小 节 的 介绍 ， 可 通过 在 二 维 窍 阵 的 每 
个 维度 上 依次 执行 一 维 FFT 来 实现 二 维 快速 侍 里 叶 
变换 (FFT2) 。 因 此 ， 需 要 首先 编写 一 维 FFT 算 
法 。 


1. 一 维 快 速 传 里 叶 变 换 一 一 CImgProcess::FFT 


作为 CImgProcess 奖 的 私有 成 员 ，FFTO 函 数 的 
调用 参数 中 complex<double> 型 的 时 域 和 频 域 数组 
指针 用 于 输入 输出 ，r 为 FFT 运 算 的 迭代 次 数 ， 此 
时 2 7 即 为 傅 里 时 变换 的 点 数 。 

由 于 在 DFT 和 FFT 中 大 量 地 用 到 了 复数 ， 所 以 
使 用 C++ 的 STL 标 准 模 板 库 中 的 复数 模板 类 以 人 简化 
程序 代 公 。 相 应 地 需要 包含 一 个 标准 头 文 件 


#include <complex>。 


FFT() 肖 数 的 完整 实现 如 下 。 





ОРИ ВИРОВЕ TT КЕЕ TT a usss 


void CImgProcess::FFT(complex<double> * TD, complex<dou 
ble> * FD, int r) 
功能 : ”一 维 快速 传 里 叶 变 换 
参数 :  complex<double> * TD: 指向 时 域 数组 的 指针 
complex<double> * FD: 指向 频 域 数组 的 指针 
int г: 2:9, BARZ 
BEE: Ж 
人 


Void CImgProcess::FFT(complex<double> * TD, complex<dou 


ble> * FD, int r) 


{ 
LONG count; // REIMER AX 
int i,j,k; // 循环 变量 
int bfsize,p; // 中 间 变 量 
double angle; // Ж 


complex<double> *W,*X1,*X2,*X; 


// VALS EAE PA AY 


count = 1 << r; 


// 分 配 运 算 所 再 存储 大 


W new complex<double>[count / 2]; 
X1 = new complex<double>[count]; 
X2 = new complex<double>[count]; 


// 计算 加 权 系 数 
for(i = 0; i < count / 2; i++) 
Í 
angle = -i * PI * 2 / count; 
W[i] = complex<double> (cos(angle), sin(angle)); 


} 


// 5 ЛХ 
тетсру(Х1, TD, sizeof(complex<double>) * count); 


// ЖАЗИ АИТ AO S E A 
for(k = 0; k < r; k++) 
l 
for(j = 0; j < 1 << k; j++) 
l 
bfsize = 1 << (r-k); 
for(i = 0; i < bfsize / 2; i++) 
l 
р = j * bfsize; 


X2[i + p] = Х1[1 + p] + X1[i + р + bfsize / 2]; 
X2[i + p + bfsize / 2] = (Х1[1і + p] - Х1[1+р + 
bfsize / 2]) * w[i * (1<<k)]; 


J 

X = Х1; 
Х1 = X2; 
Х2 = Х; 


// 重新 排序 
for(j = 0; j < count; j++) 
l 

p = 9; 

for(i = 0; i < r; i++) 


if (j&(1<<i)) 


p+=1<<(r-i-1); 
} 


} 
FD[j]=X1[p]; 


// 释放 内 存 
delete W; 

delete X1; 
delete X2; 


2. 一 维 快速 传 里 叶 反 变换 一 一 
CImgProcess::IFFT 


根据 6.3.4 小 节 中 描述 的 IFFT 与 FET 的 关系 ， 可 
以 得 到 IFFTO 函 数 编号 方式 如 下 。 


ИВИ КЕЗЕ КУЛЕ ЕЕЕ КОБЕ ЕКЕ КЕ 
void CImgProcess::IFFT(complex<double> * FD, complex<do 
uble> * TD, int r) 
功能 : EREN EARE 
参数 : ”complex<double> * FD: 指向 频 域 数组 的 指针 
complex<double> * TD: 指向 时 域 数 组 的 指针 
int r: 2:90, БИЛЕТА 
BEE: Ж 
ККЕ ЕЕ ЕЕЕ КЕ БЕ ЕЕЕ ЕЕЕ ЕЕЕ ЗЕКЕ ЕЕЕ ЕЕЕ ЕЕЕ ЕК ЕЕЕ ЕЕЕ ЕЕЕ 
void CImgProcess::IFFT(complex<double> * FD, complex<do 
uble> * TD, int r) 
l 
LONG count; // 傅 里 时 变换 点 数 
int і; // 循环 变量 
complex<double> *Х; 


// ЕЗИ EAE PA AAY 


count = 1 << r; 


// 分 配 运算 所 需 存储 器 
X = new complex<double>[count]; 


// З 13 AX 
memcpy(X, FD, sizeof(complex<double>) * count); 


// REJ 
for(i = 0; i < count; 1++) 
{ 
X[i] = complex<double> (Х[1].геа1(), -X[i].imag()); 
J 


// 调用 快速 传 里 叶 变 换 
FFT(X, TD, r); 


// ЖЕТ а НК 
for(i = 0; i < count; i++) 
{ 
Тр[1] = complex<double> (Тр[1і].геа1() / count, -Т0[ 
1].1тар() / count); 


// 释放 内 存 
delete X; 


) 


3. ARER Hi HT АЕ pa —— —CimgProcess::FFT2 


Л) НЕЕТ() 4 0, йн] РД y B Hb E Н ЛЕ ЛУ 
实现 二 维 FFT 变 换 。 


РЁ СР ЖШ) Ж ЛУ СЕЛ БИЖИ ЕН 
Тс, ОҢОИ) , ПП ТЕРУ ЛЕЛЕ J In] 275 
进行 快速 傅 里 叶 变 换 ， 并 将 频谱 图 像 存 储 到 pTo 中 
向 回 。 函 数 授 受 3 个 可 选 参数 ， 其 中 bExpand 参数 
为 True 时 算法 会 使 用 bFillColor 指 定 的 颜色 来 填充 图 
像 长 宽 全 2 的 整数 次 时 ， 售 则 算法 将 采取 裁减 图 像 
的 方式 ， 如 采用 户 需 要 接收 原始 的 FFT2 蕉 换 结 琳 
(主要 用 于 计算 反 变 换 ) ， 则 应 定义 pOutput 数 组 并 
目 行 初始 化 。 


输出 的 频谱 图 像 pTo 和 变换 直接 得 到 的 频谱 pOutput 之 间 的 区 别 ， 


pTo 实 际 上 是 用 于 普 示 的 幅度 详 图 像 ， 它 的 每 个 元 系 均 为 实数 ， 坪 
由 复数 频谱 pOutput 的 中 对 应 元 系 的 模 值 。 


pOutput 是 变换 后 卫 接 得 到 的 复数 频 应 ， 利 用 其 才能 够 计算 傅 里 叶 
REH. 


ЕЕТ2()рА 5 Ус К. 


/ KK K * * * * K K K K K K K K K * K * K K K K K K K K K K * K K K K K K K K K * K XK K K K K K K K X 


void CImgProcess::FFT2(CImgProcess * pTo, BOOL bExpand, 
complex<double> * pOutput, BYTE bFillColor) 
功能 : ERE Hi АБ]Й 
参数 : ”CImgProcess * pTo: 指 问 输出 频谱 图 像 的 指针 ， 设 置 为 NU 
LL 则 不 输出 图 像 

BOOL bExpand: 指定 使 用 何 种 方法 将 图 像 融 冤 整 定 到 的 整数 晕 


右 设 置 为 TRUE， 则 使 用 指定 两 色 扩大 图 像 ; 
右 设 置 为 FALSE， 则 从 右 侧 和 撒 部 裁 盘 图像 。 
默认 值 取 FALSE， 即 裁剪 图 像 。 
complex<double> * pOutput: 指向 原始 输出 数组 的 指针 ， 即 F 
(U,V)。 默 认 只 显示 ， 不 输出 ， 即 为 NULL 
BYTE bFillColor: 默认 值 为 255 (HE) 。 当 bExpand 被 设置 
为 TRUE 时 ， 这 个 参数 指定 使 用 何 种 其 色 扩 大 图 像 ;， 当 bExpand 被 设置 
为 FALSE 时 ， 这 个 参数 被 忽略 。 
BREE: 无 
人 
void CImgProcess::FFT2(CImgProcess * pTo, BOOL bExpand, 
complex<double> * pOutput, BYTE БЕ111Со1ог) 


{ 
double dTemp; // 中 间 变 量 


// 循环 变量 
LONG 1; 
LONG й 


// FFT2 的 宽度 和 高 度 (2 的 整数 次 方 ) 


LONG м; 
LONG h; 
int wp; 
int hp; 


// АИВ 
= 1; 
= 1 


> = ЕУ Е 
O O se 


p = ©; 
р = ©; 
// ЯА НАР J БЕЛП ERUR ) 
while(w * 2 <= GetWidthPixel()) 

l 


М *= 2; 
мр++; 


} 


while(h * 2 <= GetHeight()) 
{ 

h 25 

һр++; 
J 


// 检查 bExpand 参 数 
if ((bExpand) && (w!=GetWidthPixel()) &&(h!=GetHeight 


())) ( 


} 
// 分 配 内 存 


complex<double> *TD = new complex<double>[w * h]; 
complex<double> *FD = new complex<double>[w * h]; 


// 3EELJInJ 


for(i = 0; i < h; i++) 


l 
// 水 平方 同 
for(j = 0; j < w; j++) 


l 
// Zl] Б ЩН 
if (bExpand) 


if ((j<GetWidthPixel()) && (i<GetHeight())) 


l 
TD[j + w * i] = complex<double>(GetGray(j, i), 


9); 
} 


else 


{ 
// ЕЈ ENA y АЧИ H ЕЛЕ я 
TD[j + w * i] = complex<double>(bFillColor, 0) 


} 
} 


else 


{ 
TD[j + w * i] = complex<double>(GetGray(j, i), Ө 


); 


for(i = 0; i < h; i++) 
// Хут 5 Hi IT 2 
FFT(&TD[w * i], &FD[w * i], wp); 
J 


// АРА Ж. 


for(i = 0; i < h; i++) 
for(j = 0; j < w; j++) 
TD[i + h * j] = FD[j + w * i]; 


} 
} 


for(i = 0; i < м; i++) 
l 
// 对 x 方 同 进行 快速 传 里 时 变换 
FFT(&TD[i * h], &FD[i * h], hp); 
J 


// 更 新 输出 矩阵 
if (pOutput) 


l 
// 3EELJInJ 


for(i = 0; i < h; i++) 


l 
// 水 平方 同 
for(j = 0; j < w; j++) 


pOutput[i * м + j] = FD[j * h + i]; 


// 更 新 输出 图 像 
if (pTo) 


l 
// ЗАВ SUN 


pTo->ImResize(h, w); 


// 寻找 幅度 说 对 数 变换 的 最 大 值 与 最 小 值 ， 为 优化 幅度 谱 显 示 
输出 做 准备 

// 幅度 谱 对 数 变 换 后 的 最 大 值 和 最 小 值 分 列 定 义 如 下 

double dMax = Ө, dMin = 1Е+006; 


for (i=0; i<h; i++) 
for (j=0; j<w; j++) 


// 计算 幅度 谱 
dTemp = sqrt(FD[j * h + i].real() * FD[j * h + i 
].real() + 
FD[j * h + i]J.imag() * FD[j * h + i].imag 
()) / 100; 


// 对 数 变 换 
dTemp = Log(1+dTemp ) ; 


// 寻找 最 大 和 最 小 值 
dMax = max(dMax, dTemp); 
dMin = min(dMin, dTemp); 
J 
J 


for (i=0; i<h; i++) 
for (j=0; j<w; j++) 


// 计算 幅度 谱 


dTemp = sqrt(FD[j * h + i].real() * FD[j * h + i 
].real() + 
FD[j * h + i]J.imag() * FD[j * h + i].imag 
()) / 100; 


// 对 数 变 换 
dTemp = log(1+dTemp); 


// 改变 动态 范围 并 归 一 化 到 8~255 
dTemp = (dTemp - dMin) / (dMax - dMin) * 255; 


// 更 新 目标 图 像 

// 此 处 不 直接 取 j 和 1i， 是 为 了 将 变换 后 的 原点 移 到 中 心 

pTo->SetPixel((j<w/2 ? j+w/2 : j-w/2),(i<h/2 ? i 
+h/2 : i-h/2), RGB(dTemp, 
dTemp, dTemp)); 

J 
J 
} 


// 删除 临时 变量 
delete TD; 
delete FD; 


} 


利用 FFT20 函 数 实 现 快 速 傅 里 时 变换 的 完整 示 
例 和 被 封 竣 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView::OnFreqFEourO0 中 ， 其 中 调用 FFT20) 
РАНЧИ Аг ТА К ТХ o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 执行 FFT2 
imgInput.FFT2(&imgOutput,1); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “ 频 靖 滤波 ”> 传 里 时 变换 ”来 观察 处 理 效 果 。 


4. 二 维 快速 传 里 叶 反 变换 一 一 
CImgProcess::IFFT2 


Л HIFFTORZ Win AD АШУ H BJ ЛЕ ЙУ 
实现 二 维 IFFT 变 换 。 


该 函数 需要 原始 复数 形式 的 频谱 ， 即 FFT2 中 市 
回 的 参数 complex<double> * pOutput 作 为 输入 参 
数 ， 此 外 还 需 指定 该 频谱 的 高 蜗 尺 寸 。 反 杰 换 得 到 
的 至 域 图 像 同 样 航 存储 到 pTo 指 针 中 。 由 于 在 
FFT2() 的 处 理 中 可 能 改变 了 图 像 的 尺寸 ， 这 里 允许 
通过 可 选 参 数 IOutW 和 1OutH 来 指定 输出 图 像 的 宽 
агн үе, AERE H Л HJ И Ја АН ЧИ ДХ 
аа А 


ІЕЕТ2()рА Ж) 55 HH F -o 


/ KK K * * K * K K K K K K K K K * K * K K K K K K K K K * * K K K K K K K K K XK K XK K K K K K K K X 


void CImgProcess::IFFT2(CImgProcess * pTo, complex<doub 
le> * pInput, long lWidth, long lHeight, long lOutW, lo 
ng lOutH) 
功能 : ”二 维 快速 反 传 里 时 变换 
参数 : СІтеРгосеѕѕ * pTo: 指向 输出 图 像 的 指针 
complex<double> * pInput: 指向 输入 数组 的 指针 
long lWidth: 输入 数组 中 需要 进行 反 侍 里 叶 变 换 的 才 度 
long lHeight: 输入 数组 中 需要 进行 反 傅 里 时 变换 的 高 上 度 
long lOutW: 指定 输出 图 像 的 宽度 ， 可 以 省 略 ， 默 认 与 得 
入 数组 宽度 相同 
long 10иїН: 指定 输出 图 像 的 高 度 ， 可 以 省 略 ， 默 认 与 输 
入 数组 高 度 相 同 
返回 值 : 无 
u k L i iu u D u u ОТЕ И 
void CImgProcess::IFFT2(CImgProcess * pTo, complex<doub 
le> * pInput, long lWidth, long lHeight, long lOutW, lo 
ng lOutH) 
l 
double dTemp; // 中 间 变 量 


// 循环 容量 
LONG 15 
LONG J; 


// IFFT2 的 宽度 和 高 度 (2 的 整数 次 方 ) 


LONG W; 
LONG h; 
int wp; 
int hp; 


// ИЕ 
w = 1; 
П = 1; 


wp = 0; 
hp = 0; 


// 输出 图 像 的 高 宽 
if (lOutH == 6) lOutH = lHeight; 
if (lOutW == 6) lOutW = lWidth; 


// 计算 进行 反 傅 里 时 变换 的 宽度 和 高 度 《〈 的 整数 次 方 ) 
while(w * 2 <= lWidth) 
{ 

W *= 2; 

мр++; 


} 


while(h * 2 <= lHeight) 
{ 

ү лд 

hp++; 
J 


// 分 配 内 存 
complex<double> *TD 
complex<double> *FD 


new complex<double>[w * h]; 
new complex<double>[w * һ |]; 


// 设 定 输出 图 像 大 小 
pTo->ImResize(lOutH, lOutW); 


// 3EELJInJ 


for(i = 0; i < h; i++) 


l 
// 水 平方 同 
for(j = 0; j < w; j++) 


// 给 频 域 赋值 
FDI] +w * i] = pInput[|j + w * i]; 
} 


J 
for(i = 0; i < h; i++) 


// 对 y 方 同 进 行 快速 反 传 里 叶 变 换 
IFFT(&FD[w * i], &TD[w * i], wp); 
) 


// WTEM 
// 3EELJInJ 


for(i = 0; i < h; i++) 


l 
// 水 平方 同 
for(j = 0; j < w; j++) 


FD[i + h * j] = TD[j + w * i]; 
J 
J 


for(i = 0; i < W; i++) 


{ 
// 对 x 方 向 进行 快速 反 傅 里 时 变换 
IFFT(&FD[i * h], &TD[i * h], hp); 


} 
// 寻找 有 反 变 换 结 来 对 数 变 换 的 最 大 值 与 最 小 值 ， 为 优化 显示 输出 
做 准备 


// 对 最 大 值 和 最 小 值 分 列 定 义 如 下 
double dMax = Ө, dMin = 1E+006; 


for (i=0; i<lOutH; i++) 
l 
for (j=0; j<l0utW; j++) 
l 
// ГУЛИН 
dTemp = sqrt(TD[j * h + i].real() * TD[j * h + i]. 


real() + 
TD[j * h + 1].1тар() * TD[j * h + i].im 
ав()); 


// 寻找 最 大 和 最 小 值 


dMax = max(dMax, dTemp); 
dMin = min(dMin, dTemp); 
} 
} 
// 行 


for(i = 0; i < lOutH; i++) 


// 列 
for(j = 0; j < lOutW; j++) 


// ГУЛИН 
dTemp = sqrt(TD[j * h + i].real() * TD[j * h + i]. 
real() + 
TD[j * h + 1].1тар() * TD[j * h + i].im 
ag()); 


// 改变 动态 范围 并 归 一 化 到 8~255 
dTemp = (dTemp - dMin) / (dMax - dMin) * 255; 


// 更 新 目标 图 像 
pTo->SetPixel(j, i, RGB(dTemp, dTemp, dTemp)); 
J 
J 


// 删除 临时 变量 
delete TD; 
delete FD; 


} 
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式 ， 介 绍 如 何 利 用 IFFT2 方 法 配合 FFT2 方 法 进行 频 
域 滤波。 


6.4” 频 域 小 波 基 础 


6.4.1 ЛЕЙ Б) ЕЖЕ БЕ Ж А 


传 里 时 变换 可 以 将 图 像 从 空域 变换 到 和 频 域 ， 而 
传 里 叶 反 变换 则 可 以 将 图 像 的 频 详 他 变换 为 空域 图 
像 ， 也 即 人 可 以 直接 识别 的 独 像 。 这 样 一 来 ， 可 以 
AH TRER MLIEK R, KIRT E 
EIRE KERIEL, M Л PRR ВЕ АРШ 
НИЖА HER, MATTA 0] ИЕ Е НУ H 
HJ. МАНУ А 3 Н S| JJ РУЗЕ RJ 
HEIER K” Р АНЛА ЕАН. 

Wi НОЈ А ЛЕЛЕ: РУЛ АЕ РАТЕ 2 
[ну НН RIGER Н] ЕН Я. ЖА У у А187 E AS A ЖЕЛИ Н 
МАТ; RZ, ТЕЙИ НА EER Н] H ТЕ Z ЇН] 
中 乘积 的 全 里 叶 变 换 而 得 。 即 : 

[ (x ‚У )xh (x ‚У )= F (и ‚У ЈН (и У) 


(6-47 ) 


f x ‚У )h (x ‚У )е F (u ‚У )хН (и У) 
(6-48) 


其 中 ，FF (u,v ) 和 五 (u,v ) 分 别 表 示 f (x ,y ) 和 hh 
(х,у RETER, ПО KRR H HT 2 
对 ， 即 左 侧 的 表达 式 可 过 过 傅 里 叶 正 变换 得 到 右 侧 
的 表达 式 ， 而 右 侧 的 表达 式 可 通过 传 里 叶 反 变换 得 
到 左 侧 的 表达 式 。 


=Ñ (6-47) 构成 了 整个 频 域 滤 流 的 基础 ， 疮 积 
的 概念 曾 在 第 5 章 空 间 域 滤波 中 讨论 过 ， 而 式 中 的 
乘积 实际 上 殉 是 两 个 二 维 窍 阵 F (и, у )#HIH (и, v ) 对 
MICA Z [H] BJ е} 


6.4.2 Juke Н) K; IE 
根据 式 (6-47) МТЛ ЛУЈ) F 


步 又 
(1) 计算 原始 图 像 f(x ,y )WUJDFT, S #HUF (и, 
ү). 


(2) 将 频谱 FF (и, v EA A A Н ЧАЧ 
中 心 位置 。 


(3) 计算 滤波 器 函数 日 (u,v ) 与 F (и, v ) 3 
HG (и,у) 。 


(4) ЖНС (и, v RA В [А] А Д 
ж EHME o 


(5) 计算 第 〈4) 11 RJ 47 
Hg (x „y ) j 


А (6) Жо (x,y) 的 实 部 作为 最 终 滤波 后 的 结 来 
Ж. 


ШЕШУ ОМ ЖАП, ЕНЕ rH S PEB А K HJ 
关键 取决 于 频 域 滤波 函数 日 (u ,Vv)， 和 第 第 称 之 为 渡 
War MVEA ERZ AN EEE P HM Ek 
JERR y DURE P RERI E, M PR A И J Ж 
MWER. ARE RR Г» ЖЇН у НЕ 
йт, XEVE LTE PH ВВЕ - 5 SE 2 лж 2 ЯР) 
F 中 对 于 位 置 的 复数 元 系 ， 从 而 使 F 中 元 系 的 实 部 
和 虚 部 等 比例 的 变化 ， 不 会 改变 F 的 相位 谱 ， 这 种 
JEW Ar E AER E E XIF WA 
反 变 换 回 空域 得 到 的 滤波 结 末 图 像 g9 (x ,y ) 理 论 上 
也 应 当 为 实 函 效 ， 然 而 由 于 计算 舍 入 误 天 等 原因 ， 
可 能 会 市 有 非 间 小 的 上 庶 部 ， 通 党 将 虚 部 百 接 忽略 。 


ZJ f НМ EL AW HB EE a: lk qa ЙУ T EEL [i] 


WAP ж, ARA-ARA. 6.2; rH tJ 8 
E / J sa АКАИ АЕ (0, 0) 实 际 上 是 图 像 中 全 
部 像 系 的 灰 度 之 和 和 。 那 么 如 果 要 从 原 图 像 f(x , y) 得 
到 一 幅 像 了 系 灰 上 度 和 为 0 的 空域 图 像 g (х,у), АЙН] 
先 将 f(x ,y) 变 换 到 频 域 FE(u ,v)， 而 后 令 F(0, 0) = 
0 在 原点 移动 到 中 心 的 频谱 中 为 F (M /2, № /2)) ， 
再 有 反 变 换 回 去 。 这 个 滤波 过 程 相当 于 计算 F (и, v) 
和 如 下 的 互 (,v ) 之 间 的 乘积 。 

[0, (u,v)=(M /2,N !2) 


H(u.v) Б 
т L 其 他 


(6-49) 


ЕКЕУН (u, v NA ЖЖ ХХ), Ж 
点 位 于 (M/2,N/2) 。 显 然 ， 这 里 日 (u,v ) 的 作用 
就 是 将 点 FF (М /2, N /2) 置 零 ， 而 其 他 位 置 的 F (и, v) 
保持 不 要 。 有 兴趣 的 谈 者 可 以 目 己 答 试 这 个 简单 的 
频 域 滤波 过 程 ， 反 变换 之 后 验证 g(x,y) 的 所 有 像 
际 灰 度 之 和 是 人 否 为 0。 本 章 将 在 6.4.2 小 节 话 细 地 探 
PEHA E K H E MAENE YAY o 


6.4.3” 频 域 滤 波 的 MATLAB 实 现 


为 方便 读者 在 MATLAB 中 进行 频 域 滤 波 ， 本 书 
编写 了 imfregfilt() 函 数 ， 其 用 法 同 空 域 滤波 时 使 用 


HJimfilter0 р 2810, ХИН т ЗЕ ИЕН RRAN 
ЗИКА KHUSUS 9 68 TF 2J22200, РА НУЗИ E 
为 经 过 滤波 处 理 义 反 变 换 回 空域 之 后 的 图 像 。 





y —= 


通常 使 用 fftshiftO 函 数 将 频谱 原点 移 至 图 像 中 心 ， 因 此 需要 构造 对 
应 的 原点 在 中 心 的 滤波 器 ， 并 在 滤波 之 后 使 用 ifftshift0 函 数 将 原点 移 回 
以 进行 反 变换 。 


频 域 滤波 算法 imfregfilt0 的 完整 实现 如 下 。 


function out = imfreqfilt(I, ff) 


% imfreqfilt 函 数 XT ЖР КЕЛБЕТИ ЕК 
% ZI 输入 的 空域 图 像 | 
% 参数 ff 应 用 的 与 原 图 像 等 大 的 频 域 滤 镜 


if (ndims(I)==3) && (size(I,3)==3)  % ВСВ 
I = rgb2gray(I); 
end 


if (size(I) ~= size(ff)) 
msg1 = sprintf('%s: ЈЕ АИА K, ®®И A ', mfi 
lename); 
msg2 = sprintf('%s: 滤波 操作 已 经 取消 " ，mfilename ) ; 
eid = sprintf('Images:%s:ImageSizeNotEqual' ,mfilena 
me); 
error(eid,'%s %s',msg1,msg2); 
end 


% 快速 傅 里 叶 变 换 


% ERA 
s = fftshift(f); 


% 应 用 滤 镜 及 反 变 换 

out = s .* ff; % 对 应 元 素 相 乘 实现 频 域 滤波 
out = ifftshift(out); 

out = ifft2(out); 


% 求 模 值 


out = abs(out); 


% ЈИ EZR 
out = оиё/мах(оиї(:)); 


6.4.4 Е M] Visual C++ 实现 


JP Sapa JJ IA El ЫЛ BRAIT Ае АЈ е2 
Н Ит САКАЛ НУН) ， 并 调用 FFT20 函 数 
实现 二 维 快 速 依 里 叶 变 换 ;， 之 后 将 得 到 的 频 域 图 侵 
和 滤 镜 pdFilter 的 对 应 元 系 相 末 ， 最 后 冉 将 小 波 结 来 
进行 二 维 传 里 叶 反 变换 。 





v тё, 


НРА АНА, AWHA RJ ТАТ ЛЕ АЛ Zn] ë rH JLE VA 
ШЖ САРВ АЗАН T А NAERU) 。 对 此 所 供 了 
bFillColor Ж, п] AFRE H ЖЖ a EAH HHJ. Aru E= n] 
Везел Ji RRA MARA AE, ШЕЙ НУ ЕЛЕН ЛЕ Н] Д 4 £ 
最 低 。 


频 域 滤波 函数 FregFilt( ) 的 完整 实现 如 下 : 


/ KKK K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K * K * XK 
void CImgProcess::FreqFilt(CImgProcess * pTo, double * 
pdFilter, BYTE bFillColor) 
功能 : ”执行 频 域 泪 波 操 作 。 请 痛 完 使 用 相应 的 小 镜 生 成 函数 生成 pd 
Filter 滤 镜 。 
参数 : ”CImgProcess * pTo: 指向 输出 图 像 的 指针 

double * pdFilter: 给 定 的 频 域 滤 镜 

BYTE bFillColor: 用 来 补 章 原 图 像 使 用 的 闫 色 ， 默 认为 
HE) 。 建 议 与 图 像 右 侧 和 撒 部 这 绿 附 近 的 其 色 尽 量 保持 一 致 。 
BEE: Ж 
i 
void CImgProcess::FreqFilt(CImgProcess * pTo, double * 
pdFilter, BYTE bFillColor) 


// 计算 滤 锐 大 小 
LONG w = GetFreqWidth(); 
LONG h = GetFreqHeight(); 


// ҖЕ УСД КЖ GS 4138625446) 
complex<double> * cdFreqImg = new complex<double>[w 
*h]; 


// AER RBH R EE, UR E r S 28 2 ERUR A 1] 
ЖА ян У 
FFT2(NULL, 1, cdFreqImg, bFillColor); 


// ХА OIER, jS yuk |<] IE p о АНЗ 
for (LONG i = 0; i<w*h; i++) 
{ 


} 
// 最 后 将 小 流 结 果 进 行 传 里 叶 反 变换 


IFFT2(pTo, cdFreqImg, w, h, GetWidthPixel(), GetHei 
ght()); 


cdFreqImg[i] = cdFreqImg[i] * pdFilter[i]; 


// Ja 27228 у iH КИЙА ЛУБ an IR 
TARIA) 


// 5) HA, ЈА ИТЕ В Н 3 ЛК Е У) ЎЪ, 
// АНЕ а ИЕА Е Е К ЕЕ а АИКА |], 
// AE nI RE mia АВ ih И кал ERNE o 


// 删除 临时 频 域 图 像 
delete cdFreqImg; 





Егеде) rh Bl] T Bi УЛИ И-ДА ЗЕН 
减 的 目标 图 像 宽 高 的 函数 ， 下 面 分 别 给 出 它们 的 实 
现 。 


1. GetFreqWidth( ) 


pR ROB |а| pe БЕЛ Ж т ЛЕ ЈО PERUR т: 
w. ZğisExtending Htrue т RET ВЕ, 1 
ДД SRL BU Ж тл. JS o 





/ KK K * * K * K K K K K K K K K K K * K K K K K K K K K * * K K K K K K K K K X K XK K K K K K K K X 


inline LONG GetFreqWidth(bool isExtending = true) 
功能 : Шы p R ERMA HI TE J Е 
参数 : bool isExtending: 指定 对 宽度 的 整定 拟 合 采取 的 方法 


true 为 扩展 ， 对 应 用 给 定 闫 色 补 齐 图 像 的 右 侧 ; 
false kt, XAMMA ME E RNR 
RWE true. 

返回 值 : ”LONG 类 型 ， 整 定 后 的 宽度 计算 结果 


оаа 


inline LONG GetFreqWidth(bool isExtending = true) 


{ 
LONG w = 1; 


while(w * 2 <= GetWidthPixel()) 
W *= 2; 


// Я тоу e и, HEA ЛЕЛИ 25 ик 


° HH); 
if ( (w != GetWidthPixel()) && (isExtending) ) 
W *= 2; 
return w; 
} 


2. GetFreqHeight( ) 


12 A ZUR E у у eur К Pi mi J НОЈЕ Х 
жЕ J, S%isExtending Ntrue it RAAR, 
E Ur E BIE 5 o 





ГА KK K * * * * K K K K K K K K K * K * K K K K K K K K K * * K K K K K K K K K XK K K K K K K K K K X 


inline LONG GetFreqHeight(bool isExtending = true) 

功能 : ” 返回 频 域 小 镜 或 频 域 图 像 应 有 的 高 度 

参数 : bool isExtending: 指定 对 宽度 的 整定 拟 合 采取 的 方法 
гие, ХУЛ ЕКТ ИАЛ: 
#а15е5Ж4й, ХУЛ М B BNR- 
AWE Урие. 

返回 值 : ”LONG 类 型 ， 整 定 后 的 高 度 计算 结果 

0 


inline LONG GetFreqHeight(bool isExtending = true) 
{ 


LONG h = 1; 


while(h * 2 <= GetHeight()) 
h *= 2; 


// Жтт ЗЕ RRAZ, HE EANA e 256 Pe, 
ШЕ 
if ( (h != GetHeight()) && (isExtending) ) 
h = ° 


2 


return h; 


) 
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EMEP, RAE ЛУ BERE FIE K ERA 
ЕРЕ, MENAR MENRES ИЛЛ 
AURE. AE, BAFE a PB pl pek КО ЖЛЕ 
PIRE, САИ л у T REN AE 
EARE E Z H Ж ДУ Ж: A o 


6.5.1 理想 低 通 滤波 器 及 其 实现 
1. 理论 基础 
最 容易 想到 的 衰减 高 频 成 分 的 方法 就 是 在 一 个 


称 为 "截止 频率 ”的 位 置 "截断 ?所 有 的 高 频 成 分 ， 将 
图 像 频 谱 中 所 有 高 于 这 一 截止 频率 的 频谱 成 分 设 为 


0, КРЕ J pk ap Ap S. ВЕЗА Јо 
效果 的 滤波 需 如 图 6.16 所 示 ， 称 之 为 理想 低 通 滤波 
器 。 如 果 图 像 的 宽度 为 M ， 高 度 为 N ， 那 么 理想 低 
通 频 域 滤波 需 可 形式 化 地 描述 为 : 


Боле W 2 АРЕ»... 
| 1. [0и — 4 + (У шеш. = D. 


Н (иу) = < 
оло -—7 +(v— Zy] > D. 
(6-50) 
其 中 D ух НИКОН ЕВЕ т HJ ИШ ЛЖ, Jë 
УВ из НАЈ 268 SE Pa (Eli АЧ АУ U b, Œ ARRE 


WEI FEW А J KRL РУ ИЧЕ ло ИЕ ЖЛ 
1, HZ] УРЕ Вело ЖЇН а 70. ЗАКОНЕ 
Б а AER EERE RKA FI ЕН, GYA H tts 
件 实现 ， 这 也 是 使 用 者 称 之 为 理想 的 原因 ， 但 其 软 
Ян КЕНУЛ ТИЗЕ АПИ] +В. 


Im 
ү | 


Ф. | S| 


图 6.16 HEURE JEY Ar H h B 


BAH JE Y йт п] E E TEE F. ER КЕЕ 
声 ， 但 由 此 带 来 的 图 像 边缘 和 细节 的 模糊 效应 也 较 
为 明显 ， 其 滤波 之 后 的 处 理 效果 比较 类 似 于 5.3.1 小 
节 中 的 平均 平滑 。 实 际 上 ， 理 想 低 通 滤波 器 是 一 个 
与 频谱 图 像 同样 尺寸 的 二 维 矩 阵 ， 通 过 将 和 矩阵 中 对 
JV Ж ард [т] 2) 5140, ОКОН О СЕ 
中 心 ) 01, PE УЛИ 445 4H3 Ji A ЭСЕ ЛЛ 
БЕБЕК С ЛУ НЕ, ЭЙЕ 
ЖД р ЫЕ жЕ НН ЈОН) 。 其 中 0 与 1 的 交界 处 





ИП ХУЙЕЙ йе HJ EREDE ç 
2. MATLAB 实 现 


S ече эч ышана 以 得 到 截止 频率 
为 fed УЕ ВАКОН Е х 


Imidealflpf() 4 #17611 F -o 


function out = imidealflpf(I, freq) 
% ітідеа1Ғ1рғ 098 构造 理想 的 频 域 低 通 滤波 天 
% I 参数 得 入 的 灰 度 图 像 
% freq 参 数 低 通 滤波 融 的 截止 频率 
% BEE: out - 指定 的 理想 低 退 滤波 帮 
[M,N] = size(I) ; 
out = ones(M,N); 
for i=1:M 
for j=1:N 
if (sqrt(((i-M/2)^2+(j-N/2)^2))>freq) 
out(i,j)=0; 
end 





FK URSE H BRN `F?8 rH ЕЛА 
ЕЕС noise.bmp 为 例 ， 使 用 频 域 理想 低 
通 小 波 占 进行 处 理 ， 相 应 的 MATLAB 人 代码 如 下 。 





I = imread('baby_noise.bmp'); XZA J| 


% 生成 滤 镜 
ff = imidealflpf(I, 20); 
% 应 用 滤 镜 
out = imfreqfilt(I, ff); 


figure (1); 
subplot(2,2,1); 
imshow(I); 
title('Source'); 


% 计算 FFT 并 显示 

temp = fft2(I); 

temp = fftshift(temp); 
temp = log(1 + abs(temp)); 
figure (2); 
subplot(2,2,1); 
imshow(temp, []); 
title('Source'); 


figure (1); 

subplot(2,2,2); 

imshow(out); 

title('Ideal LPF, freq=20'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,2); 

imshow(temp, []); 

title(' Ideal LPF, freq=20'); 


% 生成 滤 锁 
ff = imidealflpf(I, 40); 
% МЕ 


out = imfreqfilt(I, ff); 


figure (1); 

subplot(2,2,3); 

imshow(out); 

title('Ideal LPF, freq=40'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,3); 

imshow(temp, []); 

title(' Ideal LPF, freq=40'); 


% 生成 滤 镜 
ff = imidealflpf(I, 60); 
% 应 用 滤 镜 
out = imfreqfilt(I, ff); 


figure (1); 

subplot(2,2,4); 

imshow(out); 

title('Ideal LPF, freq=60'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,4); 

imshow(temp, []); 

title(' Ideal LPF, freq=60'); 


上 述 程 序 的 运行 效果 如 图 6.17 和 图 6.18 所 示 。 


Source Ideal РЕ тед=20 












Ideal СРЕ ітед=40 
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Source Ideal LPF,freq=20 








图 6.18 ”理想 低 通 小 镜 的 滤波 结果 频 详 对比 图 


从 图 6.17 和 图 6.18 可 见 ， 当 截止 频 深 非常 低 
时 ， 只 有 非常 罪 近 原点 的 低频 成 分 能 够 通过 ， 图 像 
模糊 严重 ， 截 止 频 康 越 蜗 ， 通 过 的 频 认 成 分 束 越 
Z, BARRIERER, MIR N BNA E 
近 原 图 像 。 但 可 以 看 出 ， 理 想 低 通 滤波 器 并 不 能 很 
Hf B ЯЕ Bi ЕЕ pa Е | А РА РУ А ЛИШ, AMEE 
中 采用 平均 模板 时 的 情形 比较 类 似 。 下 面 ，6.5.2 小 
节 将 介绍 频 域 的 高 斯 低 通 滤波 器 并 比较 它 与 理想 低 
通 滤波 器 的 处 理 效 果 。 


3. Visual C++ 实现 


利用 Visual C++ 对 应 于 输入 图 像 的 频 域 理想 低 
通 滤 锐 的 代 公 如 下 。 





/ KK K * * * * K K K K K K K K K * K * K K K K K K K K K K * K K K K K K K K K * K K K K K K K K K X 


void CImgProcess::FreqIdealLPF(double * pdFilter, int n 
Freq) 
功能 : ”生成 对 应 于 和 输入 图 像 的 频 域 理想 低 通 滤 镜 
参数 : double * pdFilter: 指向 输出 滤 镜 的 指针 

int nFreq: JERK 
返回 值 ， Ж 
和 
void CImgProcess::FreqIdealLPF(double * pdFilter, int n 
Freq) 


{ 
// 计算 滤 镜 大 小 
LONG w = GetFreqWidth(); 


LONG h = GetFreqHeight(); 


// 滤 镜 产生 过 程 


for (int i=0; i<h; і++) 
for (int j=0; j<w; j++) 
V/ ЗЕЕВА ТЕ GIE MRE. Л п ЖИЕ 
成 滤 镜 的 4 个 部 分 


if (sqrt( pow((double)(i-h/2),2) + pow( (double)(j- 
w/2),2) ) > nFreq) 


// 在 写 入 时 对 波 镜 进行 必要 处 理 ， 按 照 MATLAB 函 数 ifftsh 
ift 的 原则 平移 
pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j<w/2 ? 
j+w/2 : j-w/2)] = Ө; 
J 


else 


pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j<w/2 ? 
j+w/2 : J-w/2)] = 1; 


}//for j 
}//for i 
J 


利用 FreqIdealLPFO 和 FreqFiltO 函 数 实现 理想 低 
通 滤 波 的 完整 示例 侯 封 汲 在 DIPDemo 工 程 中 的 视图 
X pK 2rvoid CDIPDemoView::OnFreqIdeallpfO 中 ， 
其 中 调用 FreqIdealLPFO 和 FreqFilt0O 函 数 得 到 理想 低 
通 涛 小 需 并 进行 频 域 滤 流 的 代码 请 断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 锐 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// 生成 频 域 小 镜 
double * pdFreqFilt = new double[w*h]|; 
imgInput.FreqIdealLPF(pdFreqFilt, dlg.m_nFreq); 


// Заел т р т nFrea HP а Н Е 


// MHE 
imgInput.FreqFilt(&imgOutput, рағгедғі1+); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 





上 述 程序 运行 后 会 弹出 对 话 杠 要求 用 户 设 置 窒 
下 频 蒜 。 旋 者 可 以 通过 交 盘 中 示例 程序 DIPDemo 中 
的 菜单 命令 “ 频 域 滤波 理想 低 通 滤波 ”来 观察 处 理 
ЖИЕ o 


1. 理论 基础 


Р ЯИК ВС as ЖЛ ЖЭ 2EJ ЕН 22% 


pa CA ў г В z" 
i i [ш 2) Ho- y] 02 
Н (и. t] = С L s A r W à i |, 


(6-51) 


局 斯 水 数 具有 相对 人 简单 的 形式 ， 而 且 它 的 健 里 
叶 变 换 和 傅 里 时 反 变换 都 是 实 局 斯 图 数 。 为 了 人 简 
单 ， 下 面 仅 给 出 一 个 一 维 高 斯 图 数 的 傅 里 叶 变 换 和 
BHH a Ra EZ) f, т\\ (6-52) EEE A 
融 斯 尔 数 的 傅 里 时 反 变 换 和 正 杰 换 仍 为 高 斯 图 数 ， 
该 式 的 证 明 留 给 有 兴趣 的 读者 自己 完成 (提示 : 可 
以 利用 高 斯 分 布 的 概率 密度 图 数 在 定义 域 上 积分 为 
1 的 性 质 ) 。 


Н(и) = дег? T y h(x) = Jono A 
(6-52) 
其 中 ，o 是 高 斯 曲线 的 标准 差 。 


频 域 和 与 之 对 应 的 空域 一 维 蜗 斯 冰 数 的 图 形 如 
图 6.19 所 示 。 


Н (u) ,o =3 h (x) ,o =3 





0 i : i i i i : 0 i i : : i i : : i 
-20 -15 -10 -5 0 3 10 15 20 -] —0.8 -0.6 -0.4-0.2 0 02 04 06 0.8 І 
(а) с =3 时 高 斯 函数 傅 里 叶 变 换 的 图 像 (b) o=3B, ра РА 22 K EB R 22 El @ 
H (и) ,G=] h (x) .G=] 





0 i i i i i i i 0 i ЖИЕ i i i ЭЖ i 
-20 -15 -10 -5 0 5 107 5 20 —1 -0.8 -0.0 -0.4-0.2 0 02 04 06 0.8 І 
(c) o=1 时 高 斯 函数 傅 里 叶 变 换 的 图 像 (d) ca=1 时 ， 凯 斯 图 数 本 身 的 男 数 图 像 


6.19 ”高 斯 函数 与 其 傅 里 叶 灾 换 的 图 像 


从 图 6.19 可 以 肥 现 ， 当 a ХиТ, Н (uR 
il Аё, Imh (х НЧЫ F ede ТАР Еу 2 
ШЖ. у ЖЕЩП [н] Pk НУ Ж] ДУХ: А. 频率 域 江波 
胡 越 罕 ， 小 除 的 噩 频 成 分 越 多 ， 图 像 束 越 平 消 模 
HDO ; 而 在 空间 域 ， 对 应 的 滤 流 带 束 越 徊 ， 相 应 的 
苍 积 模板 越 平 坦 ， 平 消 模糊) 效果 束 越 明显 。 


在 图 6.20 中 分 列 给 出 o 取 值 为 3 和 1 时 的 频 域 二 
维 蜗 斯 小 波 副 的 三 维 曲 面 表示 ， 可 以 看 出 频 域 下 的 
== ЕЕ йе [АВЕ ЖН КЕИ А АЕ НЕ A o 


2D 商 斯 涉 镜 ==3 ZDA IMEB о =3 





图 6.20” 频 域 二 维 融 斯 滤 锐 的 曲面 表示 
2. MATLAB 实 现 


根据 上 和 面 二 维 避 斯 低 通 小 波 问 有 的 定义 ， 可 以 编 
TJ BH KB ЖЕБЕ és JE pk РЁ ЭСИП F < 





function out = imgaussflpf(I, sigma) 


% imgaussf1lpf 函 数 构造 频 域 高 斯 低 通 滤波 郑 
% I 参数 和 输入 的 灰 度 网 像 
% sigma 人 参数 高 斯 函数 的 <em>a</em> 参 数 


[M,N] = Size(I) ; 
out = ones(M,N); 
for i=1:M 

for j=1:N 


out(i,j) = exp(-((i-M/2)^2+(j-N/2)^2)/2/sigm 
а^2); 
епа 
епа 





下 面 给 出 针对 图 像 baby_noise.bmp，sigma 不 同 
取信 时 局 斯 低 通 滤波 的 MATLAB 程 序 。 


I = imread('baby noise.bmp'); % 斌 入 原 图 像 


% 生成 滤 镜 
ff = imgaussflpf (I, 20); 
% МНЕ 
out = imfreqfilt(I, ff); 


figure (1); 
subplot(2,2,1); 
imshow(I); 
title('Source'); 


% 计算 FFT 并 显示 

temp = fft2(I); 

temp = fftshift(temp); 
temp = log(1 + abs(temp)); 
figure (2); 
subplot(2,2,1); 
imshow(temp, []); 
title('Source'); 


figure (1); 

subplot(2,2,2); 

imshow(out); 

title('Gauss LPF, sigma=20'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,2); 

imshow(temp, []); 

title(' Gauss LPF, sigma=20'); 


% 生成 滤 镜 
ff = imgaussflpf (I, 40); 
% МНЕ: 
out = imfreqfilt(I, ff); 


figure (1); 

subplot(2,2,3); 

imshow(out); 

title('Gauss LPF, sigma =40'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,3); 

imshow(temp, []); 

title(' Gauss LPF, sigma =40'); 


% 后 成 滤 镜 
ff = imgaussflpf (I, 60); 
% 应 用 小 镜 
out = imfreqfilt(I, ff); 


figure (1); 
subplot(2,2,4); 


imshow(out); 
title('Gauss LPF, sigma =60'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,4); 

imshow(temp, []); 

title(' Gauss LPF, sigma =60'); 





” ”上述 程序 的 运行 后 得 到 的 滤波 效果 如 图 6.21 所 
уо 


图 6.21 中 各 幅 图 像 所 对 应 的 频 域 图 像 如 图 6.22 
кт, жи ann. 
1] 


高 斯 低 通 滤波 器 在 a 参数 取 40 的 时 候 可 以 较 好 
地 处 理 被 高 斯 噪声 污染 的 图 像 ， 而 相 比 于 理想 低 通 
滤波 器 而 言 ， 处 理 效果 上 的 改进 是 显而易见 的 。 高 
斯 低 通 滤波 堪 在 有 效 抑制 噪声 的 同时 ， 图 像 的 模糊 
程度 更 低 ， 对 边 毕 带 来 的 泥 邯 程度 更 小 ， 从 而 使 高 
斯 低 通 滤波 右 在 通 第 情况 下 获得 了 比 理想 低 通 滤波 
器 更 为 广泛 的 应 用 。 


Source _ Gauss LPF.Sigma=20 


和 "у 
‚жуы + їй, 
= ‚ е, 





图 6.21 RIC НУ Я ЕИ 


Source Gauss LPF,Sigma=20 





Gauss LPF.Sigma=40 Gauss LPF.Sigma=60 





6.22 HREJE IVE ZH ЖУЙЕИ] EE BI 


3. Visual C++ 实现 


利用 Visual CHE БХ N BR U a ИК 
通 滤 镜 的 相关 代 但 如 下 。 


/ KK K * * * * K K K K K K K K K * * * K K K K K K K K K * * K K K K K K K K K XK K K K K K K K K K X 


void CImgProcess::FreqGaussLPF(double * pdFilter, doubl 
e dSigma) 
功能 : ERI MTAA ЧИ На B Kali Ze Ba 
参数 : double * pdFilter: 指向 输出 滤 镜 的 指针 
double dSigma: 1 #108048 175іста2: 

BEE: Ж 
uu S ЕКЕ ЕЕЕ КЕКЕТЕ K K i ЕКЕ S OS K K S ЕЕ ЕЕ / 
void CImgProcess::FreqGaussLPF(double * pdFilter, doubl 
e dSigma) 
l 

// 计算 波 错 大 小 

LONG w = GetFreqWidth(); 

LONG h = GetFreqHeight(); 


// ERT EE 
for (int i=0; i<h; i++) 
l 
for (int j=0; j<w; j++) 


{ 
// ЕЛА ТЕ СН ИЙ И, UER. EU ЈЕ 
成 小 镜 的 4 个 部 分 
// 在 写 入 时 对 滤 镜 进行 必要 处 理 ， 按 照 MATLAB 函 数 ifftshif 
t 的 原则 平移 
pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j<w/2 ? j 
+w/2 : j-w/2)] = 
exp(-(pow((double)(i-h/2),2)+pow((double)(j-w/ 
2),2))/2/pow(dSigma,2)); 
J 


*z 
J 

ХН ЕгедСаий$51,РЕ()ЛШЕгедЕП() KAE EN Fu BJ 
[Kull Н) И Е рТРрето T FE Я НАИ 
25 рк уоіа CDIPDemoView::OnFreqGausslpf() 
中 ， 其 中 调用 FreqdGaussLPFO 和 FreqFiltO 函 数 得 到 
АЛКАН ЕБ йт ЕЗЕТ ЖЛЕ YE YX JARI АТАП ТУРТ 
Ду о 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 镜 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// 生成 频 域 滤 锐 

double * pdFreqFilt = new double[w*h]; 
imgInput.FreqGaussLPF(pdFreqFilt, dlg.m dSigma); 
// 其 中 m_dSigma 为 用 户 设 置 的 Sigma 参 数 


// ”应 用 小 镜 
imgInput.FreqFilt(&imgOutput, pdFreqFilt); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 





上 述 程序 运行 后 会 弹出 对 话 框 要求 用 户 设 置 高 
斯 函数 的 Ga 参数 。 恋 者 可 以 通过 光盘 中 示例 程序 
DIPDemo 中 的 采 早 命令 “ 频 域 滤波 > геу НИКОН Е 
小 ?来 观察 处 理 效 果 。 


66 AKE р) Е и 

ЕИ А AE е КЕ ЙИ НН ИОД 27 
KEH, ОА у T |H] sk <| U И EJ К Fu BI ЈЕ 
波 之 由 对 应 天 系 。 
6.6.1 高 斯 高 通 滤 波 器 及 其 实现 
1. 理论 基础 

从 6.5.2 小 节 高 斯 低 通 滤波 器 中 的 了 H(u ) 图 像 ， 
可 以 友 现 滤波 占 中 心 频 深 处 的 值 即 为 其 最 大 值 1， 
如 未 需要 做 相反 的 滤波 操 作 ， 洲 除 低频 成 分 而 留 下 
局 频 成 分 ， 则 可 以 狂 钳 向 蛙 地 使 用 如 下 表达 式 来 获 
w 融通 滤波 其: 

H(u, v) = 1 — еа +(u— 2) ]/2о° 


(6-53) 
АИ, куйт йт Jn sp PE HH Z ИП Ө 


6.23 所 示 仍旧 以 一 维 情 况 为 例 )。 


2. MATLAB 实 现 


根据 上 面 二 维 高 斯 高 通 滤波 器 的 定义 ， 可 以 编 
写 高 斯 高 通 滤波 器 的 生成 函数 如 下 。 


function out = imgaussfhpf(I, sigma) 

% imgaussfhpf 函 数 ЈЕ нт ТРЛН Е С йт 
% I 参数 得 入 的 灰 度 图 像 

% ѕірта2: 高 斯 函数 的 Sigma 参 数 


[M,N] = size(I); 
out = ones(M,N); 
for i=1:M 

for j=1:N 

out(i,j) = 1 - exp(-((i-M/2)^2+(j-N/2)^2)/2/sigm 

а^2); 

епа 
епа 





H (u) ,Siema=l 





0 : : : : ! : : 
—20 -15 —10 一 5 10 15 20 
6.23 u Bir nu B и НДАР TE H Ж 


下 面 给 出 针对 MATLAB 示 例 图 像 coins.png，a 
取 不 同 值 时 高 斯 高 通 滤波 的 MATLAB 程 序 。 





I = imread('coins.png'); 


% 生成 滤 镜 
ff = imgaussfhpf (Т, 20); 
% 应 用 渡 镜 
out = imfreqfilt(I, ff); 


figure (1); 
subplot(2,2,1); 
1т<$һом( Т); 
title('Source'); 


% 计算 FFT 并 显示 

temp = fft2(I); 

temp = fftshift(temp); 
temp = log(1 + abs(temp)); 
figure (2); 
subplot(2,2,1); 
imshow(temp, []); 
title('Source'); 


figure (1); 

subplot(2,2,2); 

imshow(out); 

title('Gauss HPF, sigma=20'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,2); 

imshow(temp, []); 

title(' Gauss HPF, sigma=20'); 


% 生成 滤 镜 
ff = imgaussfhpf (Т, 40); 
% 应 用 小 镜 
out = imfreqfilt(I, ff); 


figure (1); 
subplot(2,2,3); 


imshow(out); 
title('Gauss HPF, sigma =40'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,3); 

imshow(temp, []); 

title(' Gauss HPF, sigma =40'); 


% 生成 滤 镜 
ff = imgaussfhpf (I, 60); 
% ЛН 
out = imfreqfilt(I, ff); 


figure (1); 

subplot(2,2,4); 

imshow(out); 

title('Gauss HPF, sigma =60'); 


% 计算 FFT 并 显示 

temp = fft2(out); 

temp = fftshift(temp); 

temp = log(1 + abs(temp)); 
figure (2); 

subplot(2,2,4); 

imshow(temp, []); 

title(' Gauss HPF, sigma =60'); 


上 述 程序 运行 后 得 到 的 滤波 效果 如 网 6.24 所 
示 。 小 波 前 后 对 应 的 频 域 图 像 如 图 6.25 所 示 。 


Source Gauss HPF.Sigma=20 





Gauss HPF.Sigma=40 Gauss HPF,Sigma=60 





图 6.24 тт НОТЕ R Ш.Ё 


Source Gauss HPF.Sigma=20 





Gauss HPF,Siema=40 Gauss HPF.Sigma=60 











图 6.25 тт В НС ZH RERA EE BI 


m ra B С йе n] A E E te HX Ps] U H 222% 
H kl, о ZAUBERN, Е О ЛУАН, < t 
舍 越 多 的 非 边 缘 信息 ; 0 参数 取信 越 大 ， 边 绿 提 取 
越 精确 ， 但 可 能 包 侣 不 完整 的 边 绿 信息 。 


3. Visual C++ 实现 


利用 Visual C++ 生成 对 应 于 输入 图 像 的 高 斯 高 
JBE pah HH F o 


/ KK K * * K K K K K K K K K K K * K K K K K K K K K K K * * K K K K K K K K K XK K XK K K K K K K K X 


void CImgProcess::FreqGaussHPF(double * pdFilter, doubl 
e dSigma) 
功能 : ”生成 对 应 于 输入 图 像 的 局 斯 局 通 滤 镜 
参数 : double * pdFilter: 指向 输出 滤 镜 的 指针 
double dSigma: 9108048 Sigma% 

返回 值 : 无 
下 
void CImgProcess::FreqGaussHPF(double * pdFilter, doubl 
e dSigma) 
l 

// 计算 小 锐 大 小 

LONG w = GetFreqWidth(); 

LONG h = GetFreqHeight(); 


// 小 镜 产生 过 程 
for (int i=0; i<h; і++) 
l 
for (int j=0; j<w; j++) 


// 先生 成 原点 在 中 心 的 沽 镜 ， 以 简化 操作 。 人 否则 需要 
分 别 生 成 滤 镜 的 4 个 部 分 
// 在 写 入 时 对 波 镜 进行 必要 处 理 ， 按 照 MATLAB 函 数 1i 
fftshift 的 原则 平移 
pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j< 
w/2 ? j+w/2 : j-w/2)] = 
1 - exp(-(pow((double)(i-h/2),2)+pow( (dou 
ble)(j-w/2),2))/ 
2/pow(dSigma,2)); 
}//for j 
}//for i 


L... 
利用 FreqGaussHPFO 和 FreqFiltO 函 数 实 现 高 斯 

融通 滤波 的 完整 示例 和 被 封 猴 在 DIPDemo 工 程 中 的 视 

25 A уоіа CDIPDemoView::OnFreqGausshpf() 

中 ， 其 中 调用 FreqdGaussHPFO 和 FreqFiltO 函 数 得 到 

п теа ДЕН ЕРЕ а ЭРТ ЕНЧА А" ЮТА КРТ 

Ду о 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 镜 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// ВРК ye Sá 

double * pdFreqFilt = new double[w*h]; 
imglnput.FreqGaussHPF(pdFreqFilt, dlg.m dSigma); 
// т dsigma 为 用 户 设置 的 Sigma 参 数 


// ”应 用 小 镜 
imgInput.FreqFilt(&imgOutput, pdFreqFilt); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 





上 述 程 序 运行 后 会 弹出 对 话 框 要 求 用 户 设 置 高 
斯 函数 的 o 参数 。 读者 可 以 通过 光盘 中 不 例 程序 
DIPDemorH В) Sñ. qp “ЖЛ ЕЁ > тартты Е 
Ж” pO ЖЕ АБИ, 

6.6.2 ” 频 域 拉 普 拉 斯 滤波 器 及 其 实现 
1. 理论 基础 


频 域 拉 普 拉 斯 算 于 的 推导 可 以 从 一 维 开 始 ， 由 
傅 里 时 变换 的 性 质 可 知 : 


d” 2 


ДШ ттр о (ш) Fiu) 


(6-54) 


AER YR ОВ T: 


д? е y) аут, у) 





РЕТ | + 一 一 = (ju) F (u. u) + [ju j Flu v) = —(w + 
Oh 
1 HF( и, 17) 
(6-55) 
KEA ККА: 


РЕТ? f(z. у) = (м? + 22) Е(ы, v) 


(6-56) 
tB БЦ AER ТУЛ hu BHS БЕ йт У: 
H(u, v) = (и? + u°) 
(6-57) 


„Кинини но, Ж ЕДШ 
sp 


H(u, v) = —[(u — FP + (6 — 2) 
(6-58) 
其 中 : M 和 NN TAA EA BJ И, те ç 
2. MATLAB 实 现 


根据 式 (6-58) ， 可 以 编写 拉 普 拉 斯 频 域 小 小 
йт JE БИ РЁ ЭСИП F o 





function out = imlapf(I) 
% imlapf 函 数 构造 频 域 拉 普 拉 斯 滤波 需 
% I 参数 m Л. HJ ЖЛЕ КЖ 


[M,N] = size(I); 
out = ones(M,N); 
for i=1:M 


for j=1:N 
out(i,j) = -((1-М/2)^2+(3-№2)^2); 
end 
end 





下 和 面 给 出 对 MATLAB 示 例 图 像 coins.png， 进 行 
频 域 拉 普 拉 斯 滤波 的 MATLAB 程 序 。 


I = imread('coins.png'); 


ff = imlapf (I); 
out = imfreqfilt(I, ff); 


figure (1); 
subplot(1,2,1); 
1т<$һом( Т); 
title('Source'); 


temp = fft2(I); 

temp = fftshift(temp); 
temp = log(1 + abs(temp)); 
figure (2); 
subplot(1,2,1); 
imshow(temp, []); 
title('Source'); 


figure (1); 
subplot(1,2,2); 
imshow(out); 
title('Laplace Filter'); 


temp 
temp 


fft2(out); 
fftshift(temp); 


temp = log(1 + abs(temp)); 
figure (2); 
subplot(1,2,2); 
imshow(temp, []); 
title('Laplace Filter'); 





Лат НЧЕ ТСС АД 96.2677 
示 。 


Source Laplace Filter 





46.26 фу ТЕ НЕЙ ZH RX Ek B 
IE R RIVE AI Ja НЧ RMA HH E|6.27FFz]s - 


SOurce Laplace Filter 





46.27 bur hu BHS Sa НС ZH ЖОЛБУ] EK, РЧ 


3. Visual C++ 实现 


利用 Visual C++ 生 成 对 应 于 输入 图 像 的 频 域 拉 
Edu Т же JVA TH F ç 


/ KK K * K * * K K K K K K K K K K K * K K K K K K K K K K K * K K K K K K K K K * K XK K K K K K K XK 


void CImgProcess::FreqLaplace(double * pdFilter) 
功能 : ”生成 对 应 于 和 输入 图 像 的 频 域 拉 普 拉 斯 滤波 器 

参数 : double * pdFilter: 指向 输出 滤 镜 的 指针 
返回 值 ， Ж 


о ЗЕ T SE ЖОКЕ ЗЕ А 


void CImgProcess::FreqLaplace(double * pdFilter) 
l 

// 计算 小 锐 大 小 

LONG w = GetFreqWidth(); 

LONG h GetFreqHeight(); 


// 滤 镜 产生 过 程 
for (int i=0; i<h; і++) 


l 


for (int j=0; j<w; j++) 


// ЖЕНИ КАТЕР АУЕ a, РАНЕЕ» ТОЛ 
要 分 别 生 成 滤 镜 的 4 个 部 分 
// 在 与 入 时 对 波 镜 进行 必要 处 理 ， 投 照 MATLAB 函 效 
ifftshift 的 原则 平移 
pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + ( 
j<w/2 ? j+w/2 : j-w/2)] 
=-(pow((double)(i-h/2),2)+pow((double 
)(j-w/2),2)); 
y//for j 
y//for i 


ХН FreqgLaplace0 4 FreqFiltO рк Zr SE EN ЛЛ у 
З ТЕБ Н] 562 ИБ Ж ТЕЮ1РОето Г. + АЈ 
M RIZ РА уоіа CDIPDemoView::OnFreqLapl() 中 ， 
Жн Н FregLaplace0 Fi FregFiltO KRE EAER hy 
普 拉 斯 滤波 器 并 进行 频 域 滤波 的 代码 片断 如 下 所 
Ду о 





// 计算 需要 生成 滤 镜 的 大 小 
LONG w = imgInput.GetFreqWidth(); 


LONG h imgInput.GetFreqHeight(); 


// ЗЕР Е Bš 
double * pdFreqFilt = new double[w*žh]; 
imgInput.FreqLaplace(pdFreqFilt); 


// ”应 用 小 镜 
imgInput.FreqFilt(&imgOutput, pdFreqFilt); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 





A Н] E Ж ЖЕН ДМ p| ES DIPDemo F J 23 
РА. > WI bk Ey — u le hy НГЕ С" ЖАД ЖК АМИ Ж 
ж о 


67 MATLAB S £ |—— 利用 
频 域 滤波 消 除 周期 噪声 


6.5 广 一 6.6 方 介绍 了 几 种 典型 的 频 域 滤 波 右 ， 
实现 了 频 域 下 的 低 通 和 高 通 滤波 ， 它 们 均 可 在 空域 
下 采用 平滑 和 锐 化 算 子 实现 。 而 本 节 准 备 给 出 一 个 
特别 适合 在 频 域 中 完成 的 滤波 和 案例， 即 利用 频 域 带 
了 咀 滤 波 右 消除 图 像 中 的 周期 噪声 。 下 和 面 就 来 看 一 下 
这 个 在 空域 中 几乎 不 可 能 完成 的 任务 是 如 何在 频 域 
中 实现 的 。 


6.7.1 llk or BH YE YX Z 


BL ДХ, HIR Н Wez BH ПЕЙЛИ P S 2981 


т УНЧА 1, Н БУЛ Д Л 2251. 6 
т ВА ВНЕ ез ВЕН т ВН ЕУ s пе Н ВН ЕУ 
сй 


1. JHAH УЕ AS 
FEAE ВН ЕУ бт J els ak 73: 


[0.| D — D, < W 
H (u. йе: W 
| LID- D, | <F 


(6-59) 


EED оН ЗЕ ЕН ORE 1] 46 ЈА pa EE 
房 ，W 是 了 组 窄 频 市 宽度 ，D 是 (u,y) 点 到 频率 原点 
的 距离 。 于 是 ， 理 想 禹 阻 滤波 右 的 频 域 特性 曲面 如 
图 6.28 所 示 。 


. x I! ШЫП | 
›з ФИТ 


| B 

| | | i 

"| |! 

> L.I M W d 
O) 


一 


一 


— 
o 





—10 —10 
46.28 SEAE rir р és Ji bka TE 


2. тат BH VE Y а 


KRP HEH [терт ËH QE йт 
tH ma B r ËH 082 HIRIAN o 


гу . 
r FP iu ui Р 
= ела ан ЕАС С ЦЕНЕ 
Граса i 


ee _1 
Hiu, v) =1—е 2 






10 


(6-60) 


其 中 D оз ЕН ГЛ 21] 259122 ЈА pa [ГУН 
A, WEHT, D 是 (u,y) 点 到 频率 原点 
HES. Jae, ЁЛ r BEE йт HJ ИДЕ Sp E [ii 
面 如 图 6.29 所 示 。 
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10—10 
图 6.29 ”高 斯 带 阻 滤波 器 的 频 域 特性 
3. ЕНЕ е ЈМАТГАВ 52)! 


М) a B ir Е ВС ин НУ хе 2 (6-60), н] 
тау Ят BEVE YX а HJ E ВКР ЭСИП F ç 





function out = imgaussfbrf(I, freq, width) 
% imgaussfbrf 函 数 构造 频 域 高 斯 市 阻 滤波 关 
% I 参数 和 输入 的 灰 度 网 像 

% freq 参 数 阻 市 中 心 频 率 

% width 参数 阻 市 宽度 


[M,N] = ѕіхе(І); 
out = ones(M,N); 
for i=1:M 
for j=1:N 
ои (1,7) =1-ехр(-Ө.5*((((1-М/2)^2+(9-№2)^2)- 
Ғгеа^2) / (ѕагі(1.^2+9). ^2) *міаёћ))^2); 
епа 


епа 





6.7.2 НУ 2S YH Л EH los pa: 


带 阻 滤波 器 常用 于 处 理 含 有 周期 性 噪声 的 网 
像 。 周 期 性 噪声 可 能 由 多 种 因素 引入 ， 例 如 图 像 获 
取 系 统 中 的 电子 元 件 等 。 本 案例 中 人 为 地 生成 了 一 
昼 带 有 周期 噪声 的 图 像 ， 而 后 通过 观察 分 析 其 频谱 
特征 ， 选 择 了 合适 的 高 斯 带 阻 滤波 器 进行 频 域 滤 
波 。 

1. 得 到 周期 噪声 网 像 

通 负 可 以 使 用 正弦 平面 波 来 摘 绘 周期 性 噪声 。 
如 下 程序 为 MATLAB 示 例 图 片 pout.tif 增 加 周期 性 噪 
声 。 





O = imread('pout.tif'); % 读 入 原 图 像 
[M,N] = size(0); 
I = O; 


for i=1:M 
for j=1:N 
I(i,j)=I(i,JjJ)+20*sin(20*i)+20*sin(20*j); 21 
期 噪声 
end 
end 


subplot(1,2,1); 
imshow(O ) ; 
title('Source'); 


subplot(1,2,2); 
imshow(I); 
title('Added Noise'); 


次 加 周期 性 噪声 前 后 的 区 列 如 图 6.30 所 示 。 


Source Added Noise 





46.30 ”添加 周期 噪声 前 后 对 比 和 网 
2. 频谱 分 析 


SEH тау г ВЕЕ а, с то ЈА HS 
图 像 的 频谱 有 一 个 了 解 。 下 面 的 命令 得 到 了 两 幅 图 
АРД o 


1 f=sfft2(L)3 

i f=fftshift(i f); 
i f=abs(i f); 

1 f=log(1+i f); 


o f=fft2(0); 

o f=fftshift(o f); 
o f=abs(o f); 

o f=log(1+o f); 


figure(1); 
imshow(o f, [ ]); % 得 到 图 6.31 (a) 
title('Source'); 


figure(2); 
imshow(i_f, [ ]); 276.31 СЫ) 
title('Added Noise'); 





FET Je i AA MIIS16.31P 2. 


Source Added Noise 





(a) 原 图 像 的 频谱 (b) 加 入 周期 噪声 后 图 像 的 频谱 





(c) 高 斯 带 阻 滤波 器 (d) 图 631 (b) 经 图 631 (c) 中 的 滤波 器 频 
WE ERER MICR IRE) 之 后 


6.31 高 斯 市 阻 滤 镜 的 滤波 结果 频 域 对 比 网 


З. НЕ 


Ай 2 846.31 (b) , ЈА BHEE M E ЙЛ 
谱 中 出 现 了 两 对 相对 于 坐标 轴 对 称 的 腕 点 ， 它 们 分 
别 对 应 于 图 像 中 水 平和 紧 下 方 同 的 正弦 噪 声 。 构 造 
[ет НЕ йт ‚ШЕЙК т ЕУ ЫЕ ТЇН 滤 除 具 有 
这 些 亮 点 对 应 的 频率 的 正弦 噪声 。 注 意 到 这 4 个 点 
位 于 以 频谱 原点 为 中 心 ， p150 为 半径 的 圆周 上 . 
此 ， 设 置 融 阻 滤波 器 中 心 频率 为 0， 频带 宽度 为 
5, ИП 6.31 (с) 所 示 ， 滤 小 后 的 频 域 效果 如 图 
6.31 (d) 所 示 。 


相应 的 程序 如 下 。 


ff = imgaussfbrf(I, 50, 5); % 构 造 高 斯 带 阻 滤波 器 
figure, imshow(ff, []); % 得 到 图 6.31 (с) 


out = imfreqfilt(I, ff); % 带 阻 滤波 
figure, imshow(out, []); % 得 到 图 6.31 (d) 


subplot(1,2,1); 
imshow(I); 
title('Source'); 


subplot(1,2,2); 
imshow(out); 
title('Gauss Filter'); 





Ба S Атау АТ тҮ [HE s T ЙБ 
小 戏 未 如 图 6.32 有 所 示 ， 可 以 看 到 周期 噪声 个 很 好 地 
ЇН, ХЕЕЕ ЖЯ ТЕ TE ER ДЄ] Е ЗЕ И] 


Source Gauss Filter 






а 2-42. 2-64 
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图 6.32 ”高 斯 带 阻 滤 镜 的 滤波 结果 对 比 图 


68 ЖЛЕ UX AS-I T ERVE UX és |Н] 
HIA ERKA 


在 6.4.1 小 节 曾 探讨 了 频 域 滤波 与 空域 滤波 之 间 
的 关系 。 这 里 则 要 更 进一步 ， 来 研究 频 域 滤波 器 与 
室 域 滤波 器 之 间 的 内 在 联系 。 


MERJE BUTER ri ENEM, ME РЕС т 
表达 了 一 系列 空域 处 理 〈 平 滑 、 锐 化 等 ) 的 本 质 ， 
即 对 噩 于 / 低 于 示 一 特定 频率 的 灰 度 变化 信息 子 以 泪 
际 ， 而 对 其 他 的 灰 度 变化 信息 基本 你 持 人 不 变 。 这 种 
卫 观 性 增加 了 频 域 小 波 右 设计 的 合理 性 ， 使 得 读音 


Н VL hE Pp ЛЕ ЇН) АИИ e йт, AAE 
6.7 世 中 利用 了 市 阻 滤 妆 从 实现 了 对 图 像 中 周期 噪声 
的 滤 除 ， 而 想 百 接 在 空域 中 设计 出 一 个 能 够 完成 如 
ЈЕ ВСЕ 35- НЧЕ С йт САЛЕХ ) 征 相当 困难 的 。 


为 了 得 到 合适 的 空域 滤波 硕 ， 很 目 然 地 想到 可 
РДА ЖЕЕ ЛИЛЕ Н (и, у), 而 后 根据 卷 积 定 
JE (sÑ (6-47) , H (u ,vv) 反 变换 至 空域 后 就 得 
到 了 至 空域 中 滤波 使 用 的 车 积 模板 h (x,y) MATHE 
їз [ 22 bk УМ йе IJ e VL А Oi , 


然而 ， 下 接 肥 变换 得 到 的 空域 知 积 模板 h (x , y 
) 同 互 (w,v ) 竺 大， 从 而 与 图 像 f(x,y ) 上 其 有 相同 的 尺 
寸 。 而 模板 操作 十 分 耗 时 ， 要 计算 这 样 大 的 模板 与 
图 像 的 郑 积 将 是 非常 低 效 的 。 在 第 3 章 中 ， 使 用 的 
都 是 很 小 的 模板 〈 如 3x3, 5х5, 7x7 等 ) ， 因 为 这 样 
的 模板 在 空 : 域 中 才 具 有 滤波 效率 上 的 优势 。 一 般 来 
说 ， 如 果 空 域 模板 中 的 非 零 元 素数 目 小 于 13“ СК 
约 13x13 见 方 ) , UH FL Eze Pk. rH TF PEL GEIRR 7J XI] 
算 ， 否则 直接 利用 巨人 u , v) 在 频 域 下 滤波 更 为 合 


е 


ТЕЗЕК ЕН Н] DL Xl, ДДД ЕЛ) ЕЁ 
А (x ‚у ) 为 指导 设计 出 的 形状 与 之 类 似 的 小 空域 
苍 积 檬 板 ， 同 样 可 以 取得 类 似 于 频 域 滤波 兹 H (и, v 
) 的 滤波 双 果 。 这 束 为 从 频 域 出 友 ， 了 最终 设计 出 具 


A KHE В E IRRI he t Г} лз ARST 
Ro 


IU (6-52) Н АУД КАВ YX ASH (и) 
БЕ F J KAR E ITRE У Л ВЈ E bk Bib h (x ) 正 好 
ЕЕ / БКА. АЁ 6.19 EXE, H (URE, h 
(x LR т» ПОЛАКО УЕ ASH (и )ËX E, Т НН ВЕ 
ЖЖ ШЧ НАЈ ЙА RX K, ЖЫТ =u БК 7 TH PL ER ©, 
MATTIE ЕА АБР я А РК ЖД (x 849738; 而 空域 下 
ГД TE BJP kah (x ) 与 水 数 f (x ) 疮 积 则 同样 会 产生 平 
清 的 效 末 。 有 再 进一步 以 hx ) 的 形状 为 指导 ， 束 可 以 
得 到 曾 在 高 斯 平 请 中 使 用 的 高 斯 模板 〈 陈 (5- 
5) ) 。 


ИЖ 
1 . 传 里 叶 级 数 的 收敛 性 

传 里 时 级 数 的 收敛 性 : 满足 犹 里 赫 利 条 件 的 周 
даананы адаан Jk B ЈИЕ 
la 

(1) 在 任何 周期 内 ，x (t ) 须 绝对 可 积 。 


(2) 在任 一 有 限 区 加 中 ，x (г) Н RERA IRA 
最 大 信 或 最 小 但 。 


(3) 在 任何 有 限 区 则 上 ，x(t) 只 能 有 有 限 个 
F 218] т. 


П. 1207 = ЯТ TE ЖЖ УРТА 
利用 欧 拉 公式 : 








(6-61) 
т (6-1) 可 转化 为 : 


1-20 
„полит —іп2лтит ` bn f inam ar — 21 À 
а. | у; [92 (e7 а ET а (ейт о тне) 
1—1 
рых b. in? b n? 
— та СТ у; [z a аїп2тшг | W, a no iniru 
n=l 
17 An — 10, An + 10 | а. 
X.“ = — Cn C-n 一 (п = 1,2,9,...) 
L 2 2 2 | 


, апатит т2л иг 
nt 


则 式 (6-62) 可 表示 为 а". 
可 将 上 去 合并 ， 人 得 到 傅 里 时 级 数 的 复数 形式 : 


аа 


тт ит 
у спе 


П — 20 


(6-64) 


为 求 得 系数 cn ， 将 式 “6-2) 代入 式 (6- 
63) ° 得 : 


(6-65) 


Th 
a P: т} Р (т)ѕіп(т2тит)ат] 


п ib, 112 pT/2 ЕЕ 
Cn = 7 = 5 үр Ti р Tr)cos[n27 ит)йт = T 
T' 2 
= + E г „fi rjcos(n2rur) — isin(n2rur)jdz 
i ' 站 — Тт ч - i rJ i 
= Ji. x f (z)e ann js (n = 1,2,38,...) 
| Т (9 
а +ib | Реа ‚ | КР 
а. л | т _ firen” ur ју (п = 1,2,3, а 
2 Гј тре | 


同样 地 ， 可 将 结果 合并 写 为 


] 了 | 
cn 一 一 J Hre "теа (n = Ü, +1, +2, +3....) 
Г 上 一 了 全 


(6-68) 


即 傅 里 叶 系 数 的 复数 形式 。 
,其 中 表示 fx) 的 频率 ， 即 :7， 而 


(6-69) 
HI. 傅 里 叶 级 数 复 指 数 形式 和 余弦 形式 间 的 转换 
由 复 指 数 形式 的 傅 里 叶 级 数 ; 


{у= 3 C, TAT UT 


于 一 一 ше 


т Үү 
= су + У (e, am ra „ей — 71] тшк | 


(6-70) 


(е) 
jia ig, g, = arctan ———— 
e Cn = ea 其 中 Relcen) 


Blen 的 实 部 与 cn 的 虚 部 的 比值 ， 为 m УХУД [PJ 
谨 疲 的 相位 。 


X, кч | = (Enl 9 П — — 6, 一 > Єл = еп је 2" 


__ У |с плит, iinan urtin Е 


п=] 


根据 欧 拉 公 却 展开 两 个 复 指数 项 多 得 傅 里 叶 级 
数 展 开 的 复 指 数 形式 。 


А 20 
fiz) = со + у 2 |с. | соз{л%2тит + Ön) 
п=1 


(6-71) 


第 7 草 АКА 


TER, BEMI БИЖ КАН. ОТЧЕ 
负 以 及 纹理 分 析 的 需求 的 括 局 ， 一 种 新 的 变换 《〈 称 
NNER) 和 悄然 出 现 。 依 立 叶 变换 一 卫 是 变换 域 
图 像 处 理 的 基石 ， 它 能 用 正弦 与 余 弱 函数 之 和 表示 
任何 分 析 浮 数 ， 而 小 波 变 换 则 基于 一 些 有 有 限 宽度 的 
基 小 流 ， 这 些小 小 不 仅 在 频率 上 古 变 化 的 ， 而 且 具 
有 有 限 的 持续 时 间 。 比 如 对 于 一 张 乐谱 ， 小 波 变 换 
ЛУ ВЕЗЕ н а НАР, т Н.т НЯ У ААН з= 
细 廊 信息， 但 是 传 里 叶 变 换 只 所 供 了 首 从 ， 局 部 信 
恩人 在 变换 中 丢人 矢 。 


本 章 的 知识 与 热点 

(1) ENIEM 
分 解 与 重 构 的 实现 
Gabor% 779873 0т 
ЕЛ ЛЛТ 
局 维 小 波 


Ас HJ Ж 28 УТ 


Ë 


(2 


Ë 


(3 


N 


(4 


Ë 


(5 


基于 Daubechies 小 波 的 二 维 图 像 分 解 与 重 构 


71 ЛЛА 


Ж ЛЭН ур дЕ П СИА КЕЕ 5 
Л. ШАА тА, Z yB PE Р Б) 
LANIRE РАМА ARR) 表示 和 分 析 有 天。 
其 优势 很 明 吕 ， 未 种 分 辩 识 下 无 法 友 现 的 特性 在 态 
一 种 分 辨 率 下 将 很 容 钨 航 肥 现 。 本 和 将 从 多 分 辨认 
的 角度 来 审视 小 波 变 换 ， 主 要 内 容 将 集中 在 简单 介 
绍 多 分 辨 率 的 相关 概念 和 信和 号 《或 图 像 ) 的 分 解 与 
ЖМ. 


711 270912255 


ERIEN Ку ХЕТ, zI AT 
中 的 重要 部 分 ， 它 将 多 种 学 科 的 扩 术 有 效 地 统一 在 
一 起 ， 如 信 志 处 理 的 子 市 编 仔 、 数 字 语 音 识别 的 积 
分 镜像 过 滤 以 及 金子 塔 图 像 处 理 。 多 分 辩 率 分 析 的 
作用 十 将 信和 与 分 解 成 不 同 空 间 的 部 分 ， 力 外 ， 它 也 
提供 了 一 种 构造 小 波 的 统一 框架 。 在 观察 图 像 时 ， 
对 于 不 同 大 小 的 物体 ， 往 往 采 用 不 同 的 分 辨识 ， 看 
物体 不 仅 斥 寸 有 大 有 小 ， 而 且 对 比 有 强 有 弱 ， 则 采 
用 多 分 辨 紊 进 行 分 析 束 凸显 出 一 定 的 优势 。 


Шап, HERNES pA Asli Sehat, ШААКЕ 
ХЛ ХИ ЕЕЕ А ЕУ АУЕН. 
在 地 球 仪 上 ， 大 陆 和 海洋 等 主要 特征 定 可 见 的 ， 而 
傈 城市 街 秆 这样 的 细节 信息 束 很 难 辨识 了 ;而 在 较 
小 的 大 度 上 ， 细 币 变 得 可 见 而 较 六 特征 部 不 匈 了 。 
因此 ， 为 了 能 够 从 当地 导 引 a 到 一 个 较 远 距离 处 的 地 
反 ， 驶 需要 一 套用 个 同 矿 度 绘制 的 地 图 。 如 岁 7.1 所 
7х, ТЕЕ © КЕЛЕА ЭЛЕНА ЕИ ЛЕ, ТЇП 
ТЕЛЛЕ 2 ma УАКЫ E, ЖЇН Pe UJ IER 
的 各 个 街道 。 这 束 是 小 波多 分 辩 识 的 优 越 性 的 体 
现 。 





(a) 中 国 地 图 (部 分 地 图 只 供 本 书 参考 | (b) 北京 地 图 
图 7.1 不 同 太 度 绘制 的 地 图 示例 


小 小 变换 正 是 疝 看 多 分 辨识 这 条 线 肥 展 起 来 
的 。 与 时 域 分 析 一 样 ， 一 个 信和 写 用 一 个 二 维 空间 表 


т, Apr Н ВЈ не JN e DEWR. ЖУЙЕШ 
RPI, ME o WJ BRA Di ERS ЭШ] [8] 9 
KPA ЕШИУ B УЛУ Г ЗЕЛ ЖП АЕ УНУ 
间 ， 如 网 7.2 所 示 。 


f Ct) 





(a) 
图 7.2 ”时 域 与 频 域 图 


考 上 不 如 图 7.3 所 示 的 乐 详 ， 它 可 以 看 作 一 个 手绘 
TZEK. 2 Стар) АЕН) ИН] 
上 上 增加， 而 时 间 《 以 地 担 来 测度 ) Шуа МЛ. Ж 
草 中 每 一 个 音符 对 应 于 一 个 将 出 现在 这 首 歌 的 乌 出 
记录 中 的 小 波 分 量 〈 音 调 狼 肥 ) 。 每 一 个 小 站 的 持 
续 视 度 都 由 音符 的 基 型 来 编 介 ， 而 不 是 由 它 的 水 平 
АЕН ан Б Т АК А НУ, ЭЕ 
ЗНАЈ ИТ, САУ пу БД ухе ЈЕР. [Н] 
№, Жа К тт АГАЕ е Rh pam 
变换 ， 因 为 它 是 用 时 频 来 重 构 信 和 号 的 。 





图 7.3” 乐 详 看 出 时 频 图 


1988 年 ，Mallat 据 出 了 多 分 辩 鞭 分 析 的 概念 ， 
从 衬 间 的 概念 上 形象 地 说 明了 小 波 的 多 分 辨 率 特 
性 。 在 介绍 多 分 辨 率 分 析 之 前 ， 先 来 了 解 一 下 天 于 
小 波 变 换 的 一 些 基 本 概念 ， 这 对 于 理解 多 分 辨 率 分 
析 有 重要 作用 。 


Вт КУМОТ Н) ВАТ 
的 基础 知识 。 泛 函 分 析 是 20 世 纪 初 发 展 起 来 的 一 个 
лс, МАЕ E Не А Е 
KATE. KAT [Н] х ЕН Sr J Pk y er. wH 
Н вА = [Ел тд s 2 uj, RETZE ЗЕ ўл 
н]. Еа АЈ ЛАКИН 18], ЕИ 
ҮРӘ Г, EH RTE л [u] уну 8. Ta Н. 


WX 为 一 非 空 集 合 ， 右 在 X 中 规定 了 线性 运 
To ло ЧУЛА ло я НУ л, ЭЕ дЕ АНЛАУ 
НУЛИ РУ Е НУР е АСЕ, MEX 为 一 线性 
2 |н] иҗ [н] вел |8] Ж TREE [АЈ НЧИ — Гара Н ўс 25 
来 定义 其 长 度 。 


TAT RAAE [BJA Ла, FIHFZRER 9 22 [8] 
的 基 及 函数 展开 的 问题 。 在 构造 小 波 函 数 和 进行 小 
站 变换 的 分 析 、 处 理 过程 中 ， 读 者 会 过 到 下 区 其 概 


念 问题 。 所 以 需要 介绍 这 些 重要 概念 。 


HRA, Wi H AZUFRE. Bep (t ) 
INT В ЛЕЯ], X лер (ft) 所 有 可 能 的 线性 组 合 构 
成 的 集合 ， 即 


A == bD пакер, а € R, k € Z) 
k 


(7-1) 
称 X 为 序列 ex (t ) 组 成 的 线性 空间 ， 即 X 
=span{ex }， 也 即 对 任意 g (t )， 可 以 表达 为 : 
glt) = > akek (t) 
(7-2) 


如 果 ey (t ) 线 性 无 天 ， 对 任意 g (t )， (7-2) 式 
中 的 系数 a 取 唯 一 的 值 ， 这 时 ， 称 {ex (0) реу 
х [АЈ ХОДА) 


Wx ,y 为 内 积 空 间 X 的 两 个 元 素 ， 若 (xy )=0, 


则 称 xy 正 区 。 在 X 中 的 元 系列 {ek HPE: 


Р ‚ Ü mÆn 
‘tm CT = 
| | 1 т=п 


(7-3) 
ШЖК {ек } 为 X 中 的 标准 正 区 系 。 


在 小 流 分 析 中 ， 多 分 辨 对 分 机 〈 在 以 后 将 会 许 
细 近 人 到) 的 核心 融 是 页 W; 空间 的 正 交 归 一 基 
orth prt keznjes (KK 为 整数 位 移 ，) 为 分 辩 率 的 级 
Ж) 。 只 要 它们 已 知 ， 吏 可 以 将 竺 分 析 图 数 x (t ) 投 
影 到 不 同 分 辩 邓 的 函数 空间 进行 分 析 。 在 了 解 了 这 
些 概念 后 ， 本 草 将 引入 小 波 的 概念 。 


在 小 波 分 析 中 ， 主 要 讨论 的 函数 空间 为 2 。 
гн) 指 R 上 平方 可 积 函数 构成 的 函数 空间 ， 即 
f) 8 (у e J | F(E | dtlt; +00 
00 е 1200), ШКЛО 为 能 量 有 限 的 信号 。 (R) 
也 第 称 为 能 量 有 有 限 的 信号 空间 。 


< (t) є (Б) , Fourier oU) 满足 允许 条 件 
С» = Га тт w <a, ЖК 6 为 一 个 基本 小 波 或 母 小 波 。 





"ШЙ, it meate Ja 
是 称 之 为 小波 "的 意义 


HR RAAR Ж Ja, ЈЕЛ) 
序列 : 


bb | 
а. ВЕ Д.а = 0) 





全 
一 一 中 | 








Фа ЪЁ) = 
val a 
(7-4) 
AER HI RIŽU O є P 的 连续 小 流 弯 换 为 
Иба, b) = (f, Фа) = =. К ше Ду lt 
Vlal . / Р 
(7-5) 


记 wW =“a) ， 可 以 看 出 ， 连 续 小 波 变换 就 是 信 
号 与 小 波 函数 的 卷 积 。 小 波 函 数 事实 上 就 是 信号 处 
理 的 一 个 滤波 器 。 其 逆 变 换 为 ， 


®=с;/ | а Wrla, bol 


aF ladb 





(7-6) 
Луй ЛЕТА Н E 6220) 空间 中 的 任意 函数 f 


(2) АУЕ FL ЛУНИН АН АРРА Бу 
Pease JH. SRE СРЕ) 204 
Ж) AEIJE ЈЕР — AE T ЫРА ZX BR BI Z 
HERT E-R ERE, BEF OERE ЕЛЕ А 
frt БЇ» LMR ATARE [А] 
f, a URA A ET Л БЕ Iy РДЕ АС АЙН 
аа 
Н #0. 


ЛЛ ЇН ШШ АВЕ ЧАР IJ E FH o 
Ha 3k НА (Е), 代表 镜头 所 起 的 作用 (如 渡 
HRE) 。b 相当 于 使 镜头 相对 于 目标 平行 移 
zJ, t 的 作用 相当 于 镜头 回 目 标 推 进 或 和 远离。 由 此 
可 见 b 仪 仅 影 响 时 频 窗 口 在 相 平 面 时 间 轴 上 的 位 
置 ， 而 t 不 仅 影响 时 频 窗 口 在 频率 轴 上 的 位 置 ， 也 
影 啊 窗 口 的 形状 。 这 样 小 波 和 变换 对 不 同 的 频 深 在 时 
域 上 的 取样 步 长 是 可 调 证 的， 也 束 是 多 分 辩 深 。 

人 在 《7-5) 式 中 ， 对 参数 a ，b 进行 展开 后 ， 吏 
得 到 了 任何 时 刻 任 总 精度 的 频谱 ， 但 是 对 实际 计算 
来 讨 ， 计 算 量 太 大 ， 所 以 考虑 将 其 离散 化 。 

APUNE РА ДЕЛА: 


| еМ rO — | Я 
Øi k [Ё] = (уб Пп Ti kbo | 


(7-7) 


ARUN У АУ: 
Wik (#) = / Ë fit) Фук (та 
(7-8) 


1. 
AROSO, ДК Э. 


М ЕЛЕН, REE ENE FR БК HY F 
ЖЕАР, {а онны 55, ЖУ, ШТ 
„ЈМ ВА НУ Е 22 E, EENE [АЈ НН B SA ТАЈ 
ЛОЯ Е ВНУКА УН В: 同时 ， 由 于 正 交 性 ， 
使 得 计算 的 误 基 更 小 ， 变 换 结 琳 “ 时 - 频 函 数 ” 更 能 反 
Юн = ЖӨЕ. 


为 了 更 好 地 理解 小 疲 变 换 ， 将 其 与 第 6 章 的 傅 
里 时 变换 对 比 ， 可 以 得 出 以 下 结论 。 
(1) 傅 里 时 变换 是 把 能 量 有 限 的 信号 ft 分 解 
到 以 few +} 为 正 交 基 的 空间 上 去 ， 小 波 变换 的 实质 
征 把 该 信号 分 解 到 Wi 所 构成 的 空间 上 去 。 


(2) 储 里 叶 变 换 用 到 的 基本 函数 只 有 sin(wt 
)， 而 小 波 函 数 具 大 个 唯一 性 。 


(3) 在 频 域 中 ， 储 里 叶 变 换 具 有 较 好 的 局 部 


化 能 力 ， 特 别 是 对 于 频率 成 分 比较 简单 的 确定 性 信 
g, BEFERZEN SENAMAN 
оак 
ЈВе7Ј. 


(4) ЛТ, Ха 的 值 越 小 相当 于 传 里 
ЖАНН ү 的 值 越 小 。 


多 分 辩 率 分 析 理 论 是 建立 在 函数 空间 概念 上 
的 。 数 学 中 ， 了 通 数 空间 是 从 集合 X 到 集合 了 的 给 定 
种 类 的 函数 的 集合 。 将 平方 可 积 的 函数 o e (n) 看 
В 62k rJ IK ыл, Вр йб H Te 
一 低 通 平滑 函数 s 对 f(t ) 做 平滑 的 结果 ， 在 逐 级 
逼近 时 平滑 函数 so 也 做 逐 级 伸缩 ， 这 了 吏 是 “多 分 辨 


率 ”， 即 用 不 同 的 分 辨 率 来 逐 级 通 近 竺 分 析 图 数 f (t 
) 。 


将 空间 做 逐 级 二 分 解 产生 一 组 逐 级 包含 的 子 空 
Н): 


(7-9) 


j 是 从 -co 到 +oo 的 整数 ，j 值 越 小 空间 越 太 ， 记 
3 表示 于 空间 之 和 的 关系 。 光 ) =4 时 ， 如 图 7.4 所 


Ап 


H 7.49] И, Ж#Н] pas see, B > -o 
PJ, мән, ЖЕЛЕК g u H RKE рК 2 Z= [А]. 


当 ;+4w 时 ，W20， 即 空间 最 终 剖 分 到 空 集 为 
iE. 


(7-11) 





47.4 ”函数 空间 的 划分 


这 种 误 分 方式 使 得 空间 5 与 空间 Wi EX, Ae 
w ZEEE, БЇ 


VLW; WLW, ji 
(7-12) 


ZETA, ZARRA R aQ 
EEFI O, CRE FIER. 


(1) — Y ВТЕ: 对 于 任意 的 ; Е, 有 TH С V; 


(жни ШУТ, кы О, 

(3) 伸缩 性 : 0 еу ел0) е, THB {ЖЕ 
I REKE, ЭЛТ ТЕЛЕ ДУУ РЁ ЖТ Н ЛЕЛЕ [a] HJ 
变化 具有 一 致 性 。 


(4) 平移 不 变性 : 对 任意 kez ， 有 
9272122) € V; = ó; (2-2 Е) є 7 (其 rH (t) 称 为 ДЇ E БЁ| 数 
《后面 详细 介绍 ) 2 。 


| (5) 正 交 基 存 在 性 : 存在 plt} € VO , 使 得 
{ф)(2-7Н4—к)|Е € Z) HJ IF AZ Ж 


URI TT E Z 2) 522 i —- # Z|] f Z lu] 
[W);ez, taO E HHI); z 产生 的 尺度 图 数 ， 用 0 作 小 
流 ， 它 的 补 空间 为 {Wiljez ， V = Va @Wjai ， 则 {Wi}jez 
TA ДУУ E |8]. 


任意 信号 ro ez 可 用 多 分 辩 率 分 析 公式 表示 
为 : 


flt) = 1. саф) + >. > dj kpj klt) 
j k 


k 


(7-13) 


KP, ЈЕ, “Í 退 剃 称 为 近似 值 


或 尺度 系数 ， da 称 为 细 市 或 小 波 系数 。 


这 是 因为 式 (7-13) 的 第 一 个 和 式 用 尺度 函数 
提供 了 了 (x ) 在 尺度 j 的 近似 (除非 ШЕЛ) у 
精确 值 〉。 对 于 第 二 个 和 式 中 每 个 较 高 尺度 的 j， 
更 细 分 辩 京 的 函数 被 添加 到 近似 中 ， 以 获得 细节 的 
增加 。 如 果 展 开通 数 形成 了 一 个 正 交 基 或 案 框 染 ， 
则 展开 系数 计算 如 下 : 


igs ДЕ рати / /()фук\т)ат 

(7-14) 
dja = (Га) pin(®)) = | рза) 

(7-15) 


ЖЛЕ РА е ТЕ ЕН EFH 
о Ае MEITA) H ЕВИ KARE ç 


在 上 述 多 分 辨 率 分 析 的 概念 介绍 中 ， 提 到 了 尺 
度 函 数 和 小 波 函 数 的 概 众 。 怎 样 理解 这 两 者 的 天 
系 ， 来 举 个 例子 。 事 实 上 ， 可 以 假设 在 三 维 空间 里 
表达 一 个 同 量 ， 则 需要 建立 一 个 三 维 的 坐标 系 ， 只 
要 坐标 系 建 并 束 可 以 用 3 个 点 (x ，y ，z ) Жї +В 
地 表示 一 个 同 量 ， 同 样 地 ， 将 一 个 信号 设 为 f(t )， 


要 想 表示 它 ， 可 以 用 一 个 个 正 交 的 简单 函数 来 构建 
坐标 系 ， 然 后 将 f(t BRI] E ES Tu] НВ Ну IE 22 pq 23 
上 ， 产 生 一 个 系数 ， 这 些 系 数 丈 可 以 等 同 于 Сх, у 
Zz), EWWA HEERA, E 
ЛАА SEER” Aaa ДИЕ 
RAM IE KAREZ f (©). 


ТЕСТ НУ ERARA Wih 
ЕРА 0, EHNE ВА 8007 АМА 5 UID, 
它 其 实 是 将 信号 映射 在 了 时 频 平 面 内 的 ， 所 以 在 实 
现 过 程 中 需要 一 个 频 域 的 夸 座 和 平台 ， 来 让 信号 f(t 
) 与 之 做 映 册 ， 而 且 征 在 一 定 的 矣 率 分 状 率 上 进行 
ЦУ, XNE RRE KROER Р РА 0, ТЕЛЕРА 
НУР Е РО НУТ, KE WANE ЈР OR 
Жел, хе ЈУВЕ RANEH S o EIE K РЕКЕ 
妆 吏 相当 于 大 度 函 数 的 作用 ， 小 波 函 数 的 实现 融 是 
[ЖЕБЕ is ЧИЗЕ H ç 


[17.1] v-e HIERNE III REH 
考虑 如 图 7.5《〈a) 所 示 的 简单 函数 





7.5 ”使 用 哈 尔 小 波 将 y=x“ 的 小 波 序列 展开 


š [1 0=х<1 
使 用 哈 尔 尺度 函数 ” l。 e AERE 
РАЗУ F 


Í 0=<х<0.5 
Ф(х) = 4—1 О5=х <1 
b 其 他 


IRISA (7-6) MA (7-7) 计算 下 列 展 开 系 
Ж: 


со(0) = J т“фо,о(т)ат = J тат 一 二 

v "AI Э 

1 0.5 .1 | 

@(0) = J T oofz)dz = J т^ = J E T НИНЕ = 
i Јо Ј0.5 





4 

| 0.25 0.5 A 

r — ч г Р. " гу I гу r i 

d (0) = | тт ож)ах = | тудат 一 J тудат = = 
Јо Јо 0.25 32 

'1 0.75 0.5 у: 

| | 34/2 

РЧ J ) I 了 | f zs 
#41) = т^ у(хж)йт = T y dT 一 тА ydr = —— 
Jo Jü J 0.75 - 


将 这 些 值 带 入 式 〈7-5) ， 可 以 得 到 如 下 小 波 
序列 的 展开 : 


] 2 2 
y= RE е, "z SETO 
Vo Wo 
\ КУФ Wo j 
J-l a WS Фф Wo@ Wi 


l 


上 述 展开 中 的 第 ыш о ы 
FTIR. 2 B = ДААН РЁ ЖАНГ ЛЕ - 
二 项 使 用 wo Mühl Jr, 子 空 间 添加 一 级 细节 来 修饰 
该 近似 值 。 其 他 级 别 的 细节 由 子 容 间 wi 的 系数 aa) 
和 am0 给 出 。 此 时 ， 展 开 函 数 现 在 已 经 接近 原始 函 
s RARE RATKAI р) RE, 
近似 值 越 变 得 接近 函数 的 精确 表示 ， 它 的 极限 是 


了 — C o 


712 分解 与 重 构 的 实现 


根据 7.1.1 小 节 的 论述 ， 可 以 知道 在 理解 多 分 办 
率 分 析 时 ， 需 要 把 握 一 个 要 点 ; 分 解 的 最 终 目 的 是 
力求 构造 一 个 在 频率 上 高 度 逼 近 的 三 (R ) 空 间 的 正 
区 小 疲 基 ， 这 些 频 紊 分 辩 座 不同 的 正 交 小 波 基 相当 
于 市 冤 各 卉 的 之 通 小 波 右 。 男 外 ， 多 分 辨识 分 析 只 
对 低频 空间 做 进一步 分 解 ， 使 频 座 的 分 辨 于 越 来 越 


һај o 


根据 7.1.1 小 节 中 的 式 〈7-13) ， 其 中 的 剩余 系 
Же. НИЧ Ах, ， 利 用 分 解 重 构 公式 : 


Cik = y holm 一 2k )C;—1.m 


T 
dik == » h ] (m == 2) 6-1 
TH 
(7-16) 


z (7-13) 中 等 号 右边 第 一 部 分 是 和 在 尺度 空 
АЈ 的 投影 ， 是 1 的 平滑 近似 ， 第 二 部 分 是 1 在 
小 波 空间 Wi 的 投影 ， 是 对 1 的 细节 补充 。 式 《7- 
16) 是 小 波 分 解 系数 的 弟 推 计算 公式 ， 式 中 l(t) 和 
分别 为 低 通 和 局 通 数 字 滤 波 右 蛙 位 取样 啊 应 。 


于 是 若 要 将 信号 由 N 水 平分 解 到 N -M 水 平 ， 则 
可 得 分 解 过 程 为 












CN_M 


对 于 任意 函数 fo < 5， ， 将 其 分 解 一 次 投影 到 r 
、w 空间 ， 即 可 分 别 得 到 剩余 系数 ИЧ B 
， 重 建 原始 信号 ， 下 式 是 变换 系数 的 重建 公式 : 


бен = у cjkhalm — 2k) + 5 d; ћу (m — 2k) 
k k 


(7-17) 


ERRIRE EIEN: 


CNM —— CN-M+1 











CN 


【 例 7.2】 信号 分 解 与 重 构 的 MATLAB 实 现 ， 
通过 对 由 两 个 正弦 信号 县 加 的 信号 进行 分 解 重 构 ， 
可 以 了 解 基 本 信号 分 解 与 重 构 的 过 程 怎 样 用 
MATLAB 实 现 。 


ЛИНЕА Д К. 


5 = АЕ X 
% 1. 下 弦 波 定义 
f1=50; % 141 
f2=100; % 频率 2 
fs=2*(fl+f2); % 采样 频率 
Ts=1/fs; % 采样 间 陋 
N=120; % 采样 点 数 
n=1:N; 


y=sin(2*pi*fl1l*n*Ts)+sin(2*pi*f2*n*Ts); % 信号 函数 


% 2N UEU Т 
h=wfilters('db30','1'); % 低 通 
g=wfilters('db30','h'); % 高 通 


h=[h,zeros(1,N-length(h))]; % 补 零 (ЯА, НКАУ 
辩 率 便于 观察 ) 
g=[g,zeros(1,N-length(g))]; % Ж= CHAER, H jm K 
分 辨 率 便于 观察 ) 
% 3 MALLAT 分 解 算 法 (圆周 卷 积 的 快速 傅 里 时 变换 实现 ) 
sig1=ifft(fft(y).*fft(h)); % ВОК) 
sig2=ifft(fft(y).*fft(g)); % (Е) 


%4 MALLAT 重 构 算法 


sigl=dyaddown (sig1); % 2 抽取 
sig2=dyaddown(sig2); % 2 抽取 
sigl=dyadup(sig1); % 2 插值 
sig2=dyadup(sig2); % 2 插值 
sigl1l=sig1(1,[1:N]); % ўна “25 
sig2=sig2(1,[1:N]); % ўна “25 


hr=h(end:-1:1); % ERE 
gr=g(end:-1:1); % МЈ 
hr=circshift(hr',1)'; % 位 置 调整 圆周 右 移 一 位 
gr=circshift(gr',1)'; % 位 置 调 整 圆 周 右 移 一 位 


sigl=ifft(fft(hr).*fft(sig1));  % 低频 
sig2=ifft(fft(gr).*fft(sig2)); % 高 频 


sig=sig1+sig2; % WES 





程序 运行 结 末 如 图 7.6 所 元 ， 从 图 中 可 以 看 出 原 
始 信 号 即 古 两 个 正 强 信和 二 的 琶 加 ， 在 经 过 局 明和 低 
通 分 解 后 ， 得 到 两 个 高 频 和 低频 的 信和 号 sig 1 与 sig 
2， 上 冉 经 过 重 构 后 ， 两 部 分 义 重 构 为 原始 信号 。 


713 图 像 处 理 中 分 解 与 重 构 的 实现 


表面 讲述 了 一 维 信号 的 多 分 辩 计 分 解 与 合成 算 
法 ， 对 于 二 维 的 图 像 信 号 ， 可 以 从 滤波 圳 的 角度 来 
理解 多 分 辨 率 分 析 。 首 先 对 图 像 先 * 逐 行 ? 做 一 维 小 
波 变 换 ， 分 解 为 低 通 滤波 工 和 高 通 滤 波 五 两 个 分 
ҥш, AZIPA ENER, 57 ЭШ, LH 
、HL 、 五 万 四 个 分 量 。 工 和 五 分 别 表 示 低 通 和 高 通 
滤波 输出 。 














0 
59) l l l 1 | 
0 20 40 60 80 100 120 se 
信号 频谱 0 20 40 60 80 100 120 
Q sig2 
] 
| | 
=] П 
0 20 40 60 80 100 120 
, 重 构 信号 
0 
0 10 20 30 40 50 60 70 80 90 100 110120 
低 通 滤波 К 
0 20 40 60 80 100 120 


0 20 40 60 80 100 120 


47.6 ”程序 运行 结果 图 
JEME, Z% RJE K Aele, y) = olol) o 


二 维 小 波 函 数 有 3 个 ， 对 应 不 同方 回 上 的 融 / 低 
Ж ЕЕЕ 


| Р, try) = р(х) ру). H L 


А х,у) = e(z)e(), LH 
(х,у) = р(т)р(у). H H 


NWAR. ТЕ» AKAA GB) K 
рур f 三 个 细 市 信号 。 所 以 每 “上 ”一 层 ， 近 似 图 
价 分 解 为 4 个 分 量 。 石 原 图 像 为 4 ， 分 解 总 层 数 为 J 
cle +1 幅 子 图 像 。 分 解 合成 过 程 可 以 表示 


LYRE Aaf (Аул (Dif Dif Di f)) 





合成 : A;jaf= АГ + Df + DI + Df 


下 图 给 出 图 像 信 己 的 快速 小 小 分 解 图 ， 如 图 7.7 
Ртл. 


h (m) Af LL 
h (n) 
Amf g (m) Df LH 


h (m) Df HL 
g (m) D; f HH 


图 7.7 图像 的 快速 小 波 分 解 框 图 
【 例 7.3】 图 像 处 理 中 小 波 变 换 的 应 用 。 


图 7.8 (а) 为 测试 图 像 ， 退 过 这 幅 图 厂 可 以 看 
出 二 维 小 流 变 换 的 方 回 敏感 性 和 边缘 检测 的 有 效 
性 。 程 序 中 利用 小 波 工 具 箱 中 的 函数 ， 人 简便 快捷 ， 
相关 的 代码 如 下 。 





f=imread('D:\1.jpg' );% 读 入 一 幅 图 
imshow(f) ;% 显 示 读 入 的 灰 虐 图 


[c,s]=wavefast(f,1,'sym4' );% 利 用 ‘sym4? 小 波 做 快速 小 波 变 换 
figure;wave2gray(c,s,-6);% 利 用 小 波 工 具 箱 的 函数 显示 变换 后 灰 
EB 


[nc,y]=wavecut('a' cys);% 利 用 小 波 工 具 箱 的 国 数 将 近似 系数 置 6 
figure; wave2gray(nc,s,-6); 
edges=abs(waveback(nc,s,'sym4'));% 边 缘 图 像 的 重 构 


figure; imshow(mat2gray(edges)); 


47.8 (а) АЛЛАА УКР. И, 

对 角 线 的 方向 性 在 图 7.8 (b) 中 可 清楚 地 看 到 。 注 
意 ， 原 图 像 的 水 平 边 缘 出 现在 图 7.8 b) 的 右上 象 
限 的 水 平 细 布 系数 中 。 对 于 图 像 的 牌 直 边缘 ， 可 以 
再 元 下 象限 的 垂 特 细 和 系数 中 共 似 地 确定 。 要 将 这 
些 信息 合并 成 一 帼 边 绿 图像， 可 以 简单 地 把 和 后 成 的 
变换 的 近似 系数 设 为 零 ， 计 算 它 的 反 变 换 ， 再 对 其 
取 绝 对 值 。 修 改过 的 变换 和 得 到 的 边 绿 图 像 分 别 显 
示 在 图 7.8 (с) 和 图 7.8 (d) 中 。 类 似 的 过 程 可 用 
于 隔离 垂直 边缘 或 水 平 边 缘 。 


гы] L T 
T „= 


TAIME ir 








(c) 将 所 有 近似 系数 设置 为 0 的 变换 (d) 重 构 得 到 的 边缘 图 像 
图 7.8 ”图像 处 理 中 边缘 检测 中 的 小 波 变换 


【 例 7.4】 利用 小 波 分 析 对 图 像 去 噪 。 


= A l 1, 并 对 其 LAS JHI Fa: ， 利用 小 波 对 
添加 噪声 后 的 图 像 进行 小 波 分 解 ， 并 观察 滤波 效 
Ж. 


相关 的 程序 代 但 如 下 。 


% 装 入 图 像 


load tire 


% 和 下面 进行 噪声 的 产生 
init=3718025452; 
rand('seed',init); 
Xnoise=X+18*(rand(size(X))); 


AZRE qa BAK E ТГ lot pa ДЈ И 
colormap(map); 
subplot(2,2,1);image(wcodemat(X,192)); 
title(' 原 始 图 像 ') 

axis square 
subplot(2,2,2);image(wcodemat(Xnoise,192)); 
title(' 含 噪声 的 图 像 '); 


axis square 


%H sym5 MIXA) RAE = ИЈУЛ 
[c,s]=wavedec2(X,2,'sym5'); 


% 下 面 进行 图 像 的 去 噪 处 理 

% 使 用 ddencmp 函 数 来 计算 去 噪 的 默认 国信 和 和 烂 标准 

% 使 用 wdencmp 函 数 来 实现 图 像 的 压缩 
[thr,sorh,keepapp]=ddencmp( 'den','wv',Xnoise); 
[Xdenoise,cxc,lxc,perf@,perfl2]=wdencmp('gbl',c,s,`'syms5 
' 2,thr,sorh,keepapp); 


ATR A 186 Ja ВИЖ 
ѕибр10+ (223) ; ітаре(Хаепоїіѕе); 
title( "去 噪 后 的 图 像 ') ; 


axis square 





运行 结果 如 图 7.9 所 示 ， 对 比 原始 图 像 和 去 噪 后 
的 图 像 ， 利 用 小 波 去 噪 后 ， 图 像 比 原 图 像 更 亮 一 
些 。 


去 噪 后 的 图 像 
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图 7.9 ЛТ F ENS E k 
[7.5] MEER H ГЕЯ. 


Же A Ia. EHR 2 ИТУЕ BREIT — Ja 
ЁЁ, AH ра 9 масЬт()3 Hy KB RE, РА 
RE 将 图 像 分 解 为 低 
频 信 息 和 疝 频 信 息 ， 图 像 的 主要 成 分 包含 在 低频 信 
КАЕН, QI EEIT PA UNEI AE. 并 改变 图 像 
的 大 小 进行 压缩 ， 分 别 获 取 两 识 压 缩 后 的 图 像 。 


相关 的 程序 代 但 如 下 。 


% е ® и = 
load пе1ес; 
indx=1:1024; 
x=nelec(indx); 


% 用 小 波 haar 对 信号 进行 三 层 分 解 
[c,1]=wavedec(x,3,'haar'); 
а1рһа=1.5; 


% RPS А J SJ Ei 
[thr,nkeep]=wdcbm(c,l,alpha); 


% 621147 Ea 

[xd, cxd, 1xd,perfð,perf12]=wdencmp('lvd',c,l,'haar',3,th 
«СЫР 

subplot(2,1,1); 

plot(indx,x); 

title( "原始 信和 号" ) ; 

subplot(2,1,2); 

plot(indx,xd); 

title( "压缩 后 的 信号" ) ; 


>> % 装 入 图 像 


load tire 


% 下 而 进行 品 再 的 产生 
init=3718025452; 
rand('seed',init); 
Xnoise=X+18*(rand(size(X))); 


% 显 示 原 始 网 像 及 它 的 含 噪声 的 图 像 
colormap(map); 
subplot(2,2,1);image(wcodemat(X,192)); 


title(' 原 始 图 像 ') 

axis square 
subplot(2,2,2);image(wcodemat(Xnoise,192)); 
title( ' 含 噪声 的 图 像 ' ) ; 

axis square 


% 用 sym5 小 小 对 图 像 信 号 进行 二 层 的 小 流 分 解 
[c,s]=wavedec2(X,2,'sym5'); 


% 下 面 进行 图 像 的 去 噪 处 理 

% 使 用 ddencmp 函 数 来 计算 去 噪 的 默认 国信 和 和 烂 标准 

% 使 用 wdencmp 函 数 来 实现 图 像 的 压缩 
[thr,sorh,keepapp]=ddencmp( 'den','wv',Xnoise); 
[Xdenoise,cxc,lxc,perf@,perfl2]=wdencmp('gbl',c,s,`'sym5 
' 2,thr,sorh,keepapp); 

% x ту E s Л Н) 4 A 

subplot(223);image(Xdenoise); 

title(' 去 噪 后 的 图 像 ') ; 


axis Square 


>> % A BZ 

load wbarb; 

% 显 示 图 像 
subplot(221);image(X);colormap(map) 
title(' 原 始 图 像 ' ) ; 


axis square 


disp( "压缩 前 图 像 X 的 大 小 : '); 
Whos( 'X ' ) 


% 对 图 像 用 bior3 .7 小 流 进行 2 层 小 波 分 解 
[с, 5 | =мауедес2(Х, 2, 'біогз.7'); 


ЕН ЈУВЕ М H в — УКО А ЖП mu Д 5 25 
са1=аррсое+2 (с, 5, 'біог3.7',1); 


chl=detcoef2('h',c,s,1); 
cv1=detcoef2('v',c,s,1); 
cd1=detcoef2('d',c,s,1); 


ATF IRT АД СЕ 行 重 构 
al=wrcoef2('a' Ел, 'bior3.7',1); 
hl=wrcoef2('h',c,s,'bior3.7',1); 
vl=wrcoef2('v',c,s,'bior3.7',1); 
d1=wrcoef2('d',c,s,'bior3.7',1); 
c1=[al,hl1;v1,d1]; 


% 泥 示 分 解 后 各 频率 成 分 的 信息 
subplot(222);image(c1); 

axis square 

title(' IE IRA ИЕА ' ) ; 


% 下 面 进行 图 像 压缩 处 理 

= ENRETE — JIRI М, HEAT RA HIE 
一 层 的 低频 信息 即 为 ca1， 显 示 第 一 层 的 低频 信息 

кол a 一 层 信息 进行 量化 编码 

cal=appcoef2(c,s,'bior3.7',1); 

cal=wcodemat(cal,440,'mat',0); 


AAE S| A HS pa JE 

cal=0.5*cal; 
subplot(223);image(cal);colormap(map); 
axis square 

title(' 第 一 次 压缩 '); 

disp( ' 第 一 次 压缩 图 像 的 大 小 为 : '); 


Whos( 'cal ' ) 


РА ЛМЕ БЕТИН М, TRIE ЕЖА Е K 
% 第 二 层 的 低频 信息 即 为 ca2， 显 示 第 二 层 的 低频 信息 
ca2=appcoef2(c,s,'bior3.7',2); 


% 首 先 对 第 二 层 信 息 进 行 量化 编码 
ca2=wcodemat(ca2,440,'mat',0); 
AAE BMR HI a ЛЕ 

ca2=0.25*ca2; 
subplot(224);image(ca2);colormap(map); 
axis square 

title( ' 第 二 次 压缩 ' ) ; 

disp(' 第 二 次 压缩 图 像 的 大 小 为 : '); 


Whos( "ca2 ' ) 
输出 结果 如 下 所 示 。 
ЖАВ ЧИХЕ ХАМ: 
Мате Size Bytes Class Attribute 
S 
X 256x256 524288 double 


第 一 次 压缩 图 像 的 大 小 为 : 
Name Size Bytes Class Attribute 
S 


cal 135x135 145800 double 


КАЧИН ЖЛ: 
Мате Size Bytes Class Attributes 


ca2 75x75 45000 double 


运行 结 未 如 网 7.10 所 未 ， 网 中 演示 了 经 过 分 解 
后 的 低频 信息 和 高 频 信 息 成 分 ， 再 对 低频 信息 成 分 
进行 压 绑 ， 将 低频 信息 进行 二 次 分 解 ， 分 解 后 再 进 
(748, ТАЙ КНН ТКН) КАИ К 


ARJU. HAAB, BRE ERE А El 
P NER AE JE RAES E НУ КАНА K E 
W, ЖАЯ: ХАА ЕНК — SaR 
EBIT HIRIE UNETE Pa НИК 

分 ) ЖАШ К, KAARE EEN IX 
E С (АЈ E RIEMEN A ИКЕН ДААН BNA RANS 
Б, ААИ АК В IRER ENR. E 
МУГ, АЈ Я ЕЈ 4R 
ПК {а Мә ЛИ Бї, п] ARMEE КАНЕ 
н КЧ Ж. 


分 解 后 低频 和 高 频 信息 第 
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ШИНЕ, EIRE RERA S ШЛУ ROSE EA 
ЭЛЕ К 25 1, ВЕЛЭ Аа = Ji] Eu 12k dt 
172707, BAAR АЛАБЕК, е А 
为 信号 的 时 域 波 形 中 不 包含 任何 频 域 信息 ， 而 频 域 
波形 中 义 不 包 含 任何 时 域 信息 。 也 束 古 说 传 立 叶 变 


Їй ЕЕ k jika ЖЭ РЫН, XPT STA HJ 
ЯС, GYA NIB X АД е 4 T Z НУРЕ ВЈ 
[МЛ RE PRETE T ERAU A Јад ДИА HS АЈ И Epi ч ЕН 
了 它 的 局 限 性 。 


早 在 1946 年 ，Gabor 注 意 到 傅立叶 变换 在 表示 
韭 平 稳 信 号 方面 的 人 不足 ， 他 退 过 与 量子 力学 中 的 不 
人 硝 定 性 原理 的 类 比 ， 发 现 并 证 明了 一 维 信 号 的 个 人 确 
定性 原理 ， 即 一 个 同时 用 时 间 和 频率 来 刻画 的 信号 
特征 受 它 的 币 守 和 持续 时 间 乘 积 的 下 限 所 限制 。 提 
出 了 一 种 新 的 算法 : Gabor 变 换 。 这 种 变换 的 基本 
思想 是 : 把 信 志 划分 成 许多 小 的 时 间 辐 隅 ， 用 傅 芯 
叶 朗 换 分 析 每 一 个 时 间 则 隅 ， 以 便 确 定 信 号 在 该 时 
АЈ ТАЈ T E ВУ. 


AS T MA Gabor J FF HI AEA e K НД H JR E, 
HFD a AH ZERA E S BY 
NIE АЧ а es, Ej 


Tt) = Ст пт, п (Ё) 


сх 


т x ” i Т i А 
Сати [Ё — naje?” LUT 


(7-18) 


Aab 为 单数 ，a RRIHET lH ТЕЛЕ, b 代 
表 栅 格 的 频率 长 度 ， 如 图 7.11 所 示 。 


Ha 


7.11 Gabor 展 开 的 抽样 栅 格 
式 《〈7-18) 中 的 Cmn 是 一 维 信号 x (t) 的 展开 系 


DO h(t) DRR, EFE, n (Е) 
Hh (t ) 做 移 位 和 调制 生成 的 ， 如 图 7.12 所 示 。 


h (t) h (t-a) h (t-na) 


na t 
h (t-a) exp (j2pi*b*t) 


HN J |, Ц 
ШИ | ШШ t 


h (t-a) exp (jJ2pi*m*b*t) 


INI | Г! М A ШШШ, 
| || || "Hii | | | || t 
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Gabor 4] b 3 =a H РА RUE ЖЕРЕ ЖҮ (т), 这 
де [K| A A H РЁ НУВ АЕА 0 ЖЕ a, АЖК 
证 了 时 域 和 频 域 的 能 量 都 相对 较为 集中 。 由 于 高 斯 
信号 的 时 宽 - 币 宽 积 满足 不 定 原理 ， 因 而 保证 了 使 
nd de ld 频率 分 辨认。 后 

续 的 研究 表明 ， 不 止 是 高 斯 函数 ， 其 他 的 窗 函 数 也 
都 可 以 用 来 构成 式 (7-18) FHERR. 


可 以 证 明 ， 如 果 ab> 1， 即 栅 格 过 稀 ， 将 缺乏 
足够 的 信息 来 恢复 原 信 号 x (t)， 当 然 ， 如 果 ab 过 
小 ， 必 然 会 出 现 信息 的 见 余 ， 这 次 似 于 对 一 维 信和 号 
抽样 时 ， 抽 样 频 对 过 大 的 情况 。 因 此 ， 当 : 


ab= 1 时 ， 称 为 临 弄 抽样: 
ab> 1 时 ， 称 为 到 抽样: 
ab< 1 时 ， 称 为 过 抽样 。 


要 从 时 频 二 维 空间 分 析 信 握 ， 自 完 必须 构造 同 
时 用 时 间 和 频率 表示 的 时 间 函 数 。Gabor 在 1946 年 
提出 了 这 样 一 种 构 迄 函数 一 一 复 语 图 。 


Fy gito шу) = {ф{#}, git — toje) = J Ф) (Е toje Тю 


š. — P) 
一 


(7-19) 


О J. VO 
， 本 节 构 造 的 是 209 与 g (t ) 的 时 间 平 移 g (t -to ) 和 频 
率 调 制 形式 em 的 复数 共 轿 的 内 积 。foslowo) 其 实 是 
0000 0—0) 的 Fourier 变 换 。 利 用 求 地 公式， 可 以 从 复 
ЖЫР ЕУ Ei 500) : 


| 0) еа | 
pit) = — J J Fo alta, шо) я (ё — ®)е7'°' А ашу 
ал RY 
(7-20) 


ш} Уа 500, АБНА ИЩ, H 
再 知道 复 谱 网 在 一 组 网 格 点 (о = mT. w = по, m ‚п 为 整 


数 ) 的 值 妈 可 ， 其 中 wr-2: 《临界 采样 ) 。 
复 详 图 在 网 格 后 的 取 值 /m 5]: 


i PS I 
| od — xi 


(7-21) 


由 于 灾 抽 梓 时 国有 的 缺点 ， 因 此 人 们 很 少 研究 
它 。Gabor 最 早 提 出 的 是 使 用 高 斯 窗 ， 并 取 !I 临 寞 抽 
样 。 但 是 ，Gabor 展 开 的 这 一 想法 长 期 没有 被 重 
钢 ， 其 主要 原因 是 由 于 展开 系数 计算 的 困难 。 下 到 
1980 年 Bastiaans 提 出 了 用 建立 辅助 函数 和 对 个 函数 
来 求解 展开 系数 的 方法 之 后 ，Gabor 展 开 的 研究 才 
引起 了 人 们 的 兴趣 。 


从 理论 上 讲 ，Gabor 展 开 的 讨论 和 时 频 分 布 、 
滤波 亏 组 及 小 波 变 换 等 新 的 信号 处 理 理论 黎 切 相 
天 。 因 此， 这 些 新 的 信号 处 理 理论 的 应 用 也 涉 太 
Gabor 展 开 有 的 应 用 。Gabor 展 开 在 信 了 号、 图 像 的 表 
示 ， 语 音 分 析 ， 目 标识 别 ， 信 号 的 瞬 态 检测 等 各 方 


面部 取得 了 较 好 的 应 用 成 来 。 
FENA MER y Gaborik FRAAI T 
算 。 


Ф 


р | я 
Ят п) = glt — najel 2" 


(7-22) 


Cmn = Е qaa (#)) = [тга = naje 227" dz 


(7-23) 
比较 式 〈7-22) 与 式 〈7-23) , УШУ: 
Cmalt) = ГЕТ (т.л) 
( 7-24) 


妈 Gabor 系 数 是 在 离散 顶 格 上 求 出 的 STFT。 通 
常 ， 式 〈7-23) 称 为 Gabor 变 换 ， 式 〈7-22 ) 称 为 
Gabor Jf. 


将 式 (7-24) 代入 式 (7-22) 中 ， 有 


rit) = y y` (аі). т.п) hmn (Ф) 
= у ауе ЕЛ ЈА 
m п E w 
== T Ti Г ) ва БЕ Gan | t ) Las ағ 
m A 


(7-25) 
ЈА S Tx (t )， 则 必 有 有 
> > mnl Рн п (E) = ó [l _ Ё) 
(7-26) 


zÑ (7-26) 给 出 了 为 保证 由 Cmn 恢复 x (t), hm 
ni) 和 gm п (应 芝 循 的 条 件 。 满 足 该 条 件 的 hn п (t 
) 和 被 称 为 是 完备 的 。 


由 了 式 〈7-26) ЖАУ Н ВЕРА УҺ (Е): 
偶 母 函数 g (t ) 之 间 的 关系 : 


J glt)h — паје I rmbt g = ёй 
(7-27) 
该 式 称 为 g(t ) 和 h (i) 之 间 的 双 正 交 关 系 。 显 


然 ， 若 m,n 中 有 一 个 不 为 零 ， 上 式 的 积分 即 为 零 。 
жт =n =0， 则 
| ашк фа! = ] 


(7-28) 


以 上 给 出 的 关系 是 在 ap =1， 即 临界 抽样 的 情 
况 下 得 到 的 。 由 上 面 的 讨论 ， 可 得 到 一 个 求解 
Gabor 系 数 的 方法 。 


(1) WF DRR RERO h(t). 


(2) 求 其 对 偶 函 数 g (t )， 使 之 满足 式 (7- 
26) 和 式 (7-27) 。 


(3) 按 式 (7-24) 做 内 积 ， 从 而 得 到 Cn п: 


上 面 的 分 析 表 明 ， 任 意 可 以 用 高 斯 水 数 调 制 的 
复 正 强 形式 表示 的 信号 都 可 以 达到 时 域 和 频 域 联合 
不 人 确定 关系 的 下 限 ， 可 以 同时 在 时 域 和 频 域 获得 最 
佳 的 分 辨 率 ， 这 种 表示 是 Gabor 函 数 的 最 初 形式 。 


最近 二 三 十 年 ， 随 着 神 经 生理 学 和 小 波 变 换 技 
术 的 发 展 ，Gabor 函 数 逐 渐 演 变 为 二 维 小 波 的 形 
式 。 二 维 Gabor 小 波 变 换 是 图 像 的 多 尺度 表示 和 分 
析 的 有 力 工 具 ， 作 为 唯一 能 够 取得 时 域 和 频 域 联合 
不 确定 关系 下 限 的 Gabor 函 数 经 常 被 用 作 小 波 基 函 
数 ， 对 图 像 进 行 各 种 分 析 。 前 一 节 的 内 容 告 诉 读者 
小 波 变 换 契 用 一 组 滤波 融 4 疯 数 与 给 定 信 号 的 卷 积 来 
表示 或 通 近 一 个 信号 。 二 维 Gabor 滤 波 器 的 函数 形 
式 可 以 表示 为 : 








И? ИТТЕ 2 
202) = ПА ех e IEAI ех И от] 一 ех 全 二 | 
Ps xP, бы? (EXP k +; xP. E 
(7-29) 
= 7 Кут | | | К, COS Лы 
k; = E: =A ое 
пу ‚ бт sIn u 
(7-30) 


式 中 ，= 为 给 定位 置 的 图 像 坐 标 ，5 为 滤波 器 
的 中 心 频率 ; vw 体现 了 滤波 可 的 方 回迁 择 性 。 


在 自然 图 像 中 ， = 用 来 补偿 由 频率 决定 的 能 
Е) еә г) 用 来 约束 平面 波 的 高 斯 包 络 
ЮЖ ortt) 为 复数 值 平面 波 ， 其 实 部 为 余弦 平面 
波 oos(ijz) ， 虚 部 为 正弦 平面 波 sin(ijz) ; 由 于 余弦 平面 
波 关 于 高 斯 窗口 中 心 偶 对 称 ， 在 高 斯 包 络 函数 的 约 
束 范围 内 ， 其 积分 值 不 为 0; 而 正弦 平面 波 关于 高 
斯 窗口 奇 对 称 ， 在 高 斯 包 络 函数 的 约束 范围 内 ， 其 
只 分 值 为 0;， 为 了 消除 图 像 的 了 二流 成 分 对 二 维 Gabor 
小 波 变 换 的 有 影响， 在 复数 值 平面 波 的 实 部 减 去 
ехр(=®), ， 这 使 得 二 维 Gabor 小 波 变换 不 受 图 像 灰 度 绝 
对 数值 的 影响 ， 并 且 对 图 像 的 光照 变化 不 敏感 。 


二 维 Gabor 滤 波 器 是 带 通 滤波 器 ， 在 空间 域 和 
频率 域 均 有 较 好 的 分 辩 能 力 ， 它 在 空间 域 有 良好 的 
方向 选择 性 ， 在 频率 域 有 良好 的 频率 选择 性 ， 二 维 





Gaborik н] Р Н БИЖ АУМИН Ну ВЕТА BR 77 
н] Уй s. Я Сарог//\ Н И) ЭОЖ. [ 
EEE ТАЗ BRI AKA 20, ЖЕГЕМИН = 
的 表达 能 


二 维 Gabor 小 波 是 由 二 维 Gabor 滤 波 器 函数 通过 
尺度 伸缩 和 旋转 生成 的 一 组 滤波 器 ， 其 参数 的 选择 
通常 在 频率 空间 进行 考虑 。 为 了 对 一 幅 图 像 的 整个 
频率 进行 采样 ， 可 以 采用 具有 多 个 中 心 频 雍和 方 回 
的 Gabor 滤 流露 组 来 摘 述 图 像 。 参 数据、 的 不 同 选 
择 分 别 体现 了 二 维 Gabor 小 波 在 频率 和 方向 空间 的 
ы Mo ИЕ Е жт E и, WW ОХ Ж 


AF, o 为 用 倍 频 程 表 示 的 半 蜂 市 宽 ， 当 ,=05 
倍 频 程 时 ， т =з дп $ 当 s=1 倍 和 频 程 时 ， тзп $ РЕ: 
TERT, т=2.5 。 


73 第 见 小 波 分 析 


小 波 变 换 的 基本 思想 是 用 一 组 小 流 函 数 或 者 基 
疯 数 表示 一 个 函数 或 者 信号 。 信 二 分 析 一 般 古 为 了 


yK sh] ЇН] 12912 ku 2 [Н] уН HK 5, SAH Ей 
提供 了 有 天 频率 域 的 信息 ， 但 时 间 方 面 的 局 部 化 信 
轧 却 基本 丢失 。 与 傅立叶 变换 不 同 ， 小 溉 变换 通过 
平移 母 小 站 或 基本 小 波 可 获得 信 忆 的 时 间 信 息 ， 而 
ЖЧ ДАЛИЛ ИК ЛЕВИ BE nak dai э АЧУУ 
МЕ. ÆRE, ЗУМА хе АЈА Л #E HJ 
ЖХ, RINE ШИИ н» ЯҢ ТМА хе ЛУШУ АНЛА. 
РР EJ ЖИИ, KIE э НАЛ 


与 标准 有 的 传 立 叶 变 换 相 比 ， 小 波 分 析 中 所 用 到 
的 小 波 函 数 具 有 不 唯一 性 ， 即 小 波 函 数 共 有 多 样 
性 。 小 度 分 析 在 应 用 中 的 一 个 十 分 重要 的 问题 束 是 
最 优 小 溉 基 的 选 撞 问 题 ， 因 为 用 不 同 的 小 疲 基 分 
析 ， 同 一 个 问题 会 产生 不 同 的 结果。 目前 使 用 者 主 
要 是 明 过 用 小 波 分 析 方 法 处 理 信号 的 结果 与 理论 结 
аана 


КАКЕ ЛА) ДУРИ, ЛУУ РЁ ЖЧ НОВ ЛАН 
ДУ, СОИ д РАЛЬ 


(1) е0). кш), 00) 和 slw) 的 文 撑 长 度 ， 即 当时 
ЇН] ОЛДУ a [8] Ж 39 XF, <), в), о) 和 so 从 一 
个 有 限 值 收敛 到 0( 注 : об AREKO M KA 
2 上 0 可 以 由 它 求 出 来 〉。 


(2) 对 称 性 ， 它 在 图 像 处 理 中 可 以 很 有 效 地 
Ji 1 $H 


(3) EME, ТЕЗМӘ ЕИН ЭКУ 
较 好 的 平 清 效 来 作用 上 十 非 昔 有 用 的 。 


具有 对 称 性 的 小 波 不 产生 祖 位 辐 变 ， 有 共有 好 的 
正则 性 的 小 波 ， 多 于 获得 光 清 的 重 构 曲 线 和 图 像 ， 
М.т н] РАЖ Ух Ж: 


在 本 节 中 ， 主 要 介绍 常用 的 Haar 小 波 和 
Daubechies 小 流 。 
7.3.1 Нааг 


Haar 疯 数 是 小 波 分 析 中 最 早 用 到 的 一 个 具有 紧 
支撑 的 正 交 小 波 函 数 ， 也 是 最 简单 的 一 个 小 波 函 
数 ， 它 是 支撑 域 在 t E[0，1] 范 围 内 的 单个 矩形 波 。 
Наагр 22 J E ХАЛ F: 








(7-32) 


Haar 小 波 的 形状 图 如 图 7.13 所 示 。 


0 0.5 1 
7.13 Haarr ХР 
Haar 小 小 在 时 域 上 万 个 连续 夹 有 的 ， 所 以 作为 基本 


小 波 ， 其 性 能 不 是 符 别 好 。 但 它 也 有 目 己 的 优点 ， 
如 以 下 几 方面 


(1) 计算 简单 。 
(2) ob 不 但 与 pldi ех) IEE (I eltje(2t)dt = 
) ， 而 且 与 自己 的 整数 位 移 正 交 ， 即 - 


ШК, Ф.-Л АН, Нааг/\ J 
成 一 组 最 简单 的 正 交 归 一 的 小 波 族 。 


例如 ， 对 只 有 4 个 像 际 的 一 维 图 像 进 行 Haar 小 
клей» СЕИЛ КНУ (11957) 。 用 Haar 
小 波 变 换 的 过 程 是 : 计算 相 邻 像素 对 的 平均 值 ， 得 
< 要 昼 分 辩 率 为 原 图 像 二 分 之 一 的 新 图 像 : (10 

这 时 ， 图 像 信息 已 经 部 分 丢失 ， КА 
ү» 图 像 中 重 构 出 4 个 像素 的 原 图 像 ， 
Е ЕНУ ВЕИТ 
ЕТЕ М ВИ АЈА А К о КК, ЖЕ АЈ 
用 两 个 平均 值 以 及 两 个 细节 系数 表示 : (1061 
1) 。 可 以 把 第 一 步 变换 得 到 的 图 像 进一步 变换 ， 
原 图 像 两 级 变换 过 程 如 表 7.1 所 示 。 


表 7.1 ”Haar 小 波 变 换 过 程 





Haar 小 波 变 换 过 程 实际 上 是 用 来 求 平均 值 和 天 
值 的 方法 对 函数 或 图 像 进 行 分 解 ， 对 于 上 例 ， 可 做 


HW НЈУ. 


对 于 二 维 图 像 ， 同 样 可 以 用 依次 对 行 、 列 进行 
小 流 变 换 ， 得 到 二 维 图 像 分 解 方法 。 这 时 经 过 一 次 
小 流 变 换 得 到 的 古 二 维 图 像 的 近似 值 以及 水 平 、 重 
直 和 对 焦 细 节 的 分 量 ， 显 然 从 二 维 图 像 的 近似 值 、 
水 平 什 、 垂 直 全 以 及 对 角 细 布 分 量 信 可 以 重 构 出 原 
来 的 二 维 图 像 。 


【 例 7.6】 利用 haar 小 波 对 信号 进行 分 解 并 压 
缩 信号 。 


使 用 函数 wdcbm0) 获 取信 号 压缩 阔 值 ， 然 后 采 
用 函数 wdencmO 实 现 信号 压缩 。 程 序 相关 代码 如 


% 泛 载 信号 
load nelec; 
indx=1:1024; 
x=nelec(indx); 


% 用 小 波 haar 对 信号 进行 三 层 分 解 
[c,1]=wavedec(x,3,'haar'); 


alpha=1.5; 
% RPS Я J SJ Ei 
[thr,nkeep]=wdcbm(c,l,alpha); 


% “1а = 3841 Ea 
[xd, cxd, 1xd,perfð,perf12]=wdencmp('lvd',c,l,'haar',3,th 


Rs е 
subplot(2,1,1); 
plot(indx,x); 
title( "原始 信和 号" ) ; 


subplot(2,1,2); 
plot(indx,xd); 
title( "压缩 后 的 信和 号" ) ; 





程序 运行 结果 如 图 7.14 所 示 ， 用 Haar 小 波 对 信 
= BE s rik], REUS 5 КАЙ ВИН, AAT si 
ЖАНЕ. ЛЕНА, Жав s H Y 
ША М5 t ЈА fE Fl. 


原始 信和 号 
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47.14 ”信号 压缩 结 
7.3.2 ”Daubechies 小 波 


Daubechies 小 波 是 由 世界 阁 名 的 小 波 分 析 学 者 
Inrid Daubechies 构 造 的 小 波 冰 数 。 一 般 写 成 dbN 
;，N 是 小 波 的 阶 数 。 小 波 z 中 和 尺度 函数 so0 中 的 文 
择 区 为 2N -1, <ü) 有 的 消失 类 为 N 。 除 N =12F, ал 
不 具有 对 称 性 〈 即 非 线性 相位 ) 。dbN 没有 明确 的 
表达 式 〈 除 了 N=1 外 ) ， 但 转换 函数 h 的 平方 模 是 
很 明确 的 。 


жы Nl ЖҮ | І 
4Р0 i Ë a d ， 其 中 RH ZRA £ 
Ж, 则 有 : 


тош) | = (co (2) J P(e a | 
(7-33) 
A rH, та(ш) = = -5 Е 2 hgg 280 
Daubechies 小 波 具 有 以 下 特点 。 


(1) 在 时 ea El] a) KES 


R. HWH oa ИА ДАЛЕ 700-0, p=0-N. NË 
越 大 ， v0 的 长 度 ЗЕ - 
(2) 在 频 域 上 vtw) 在 w=0 处 有 NN 阶 零 点 。 


(3) “和 它 的 整数 位 移 正 交 归 一 ，R 
Г e(t)e(t — k)dt = ó 。 


(4) е0 ДУ РЁ 可 以 由 所 谓 的 “尺度 函数 ”ot 
Жж. Лр о) 为 低 通 函数 ， 长 上 度 有 限 ， 支 撑 
域 在 t =0—2N -1 范围 内 。 


【 例 7.7】 利用 db1 小 波 对 图 像 进 行 分 解 和 重 
KJ. 


— ТА НАЛУУ ЛЕТА А bedt Y TU М5у12(), 
办 为 它 不 对 分 解 系 数 进 行 下 采样 ， 所 以 蛙 层 分 解 和 
多 层 分 解 的 结 末 古 一 样 的 。 和 程序 相关 代码 如 下 。 


load noiswom 
[swa,swh,swv,swd]=swt2(X,3,'db1'); 


% 使 用 db1 小 波 对 noiswom 图 像 进行 三 层 静态 小 波 分 解 

whos 

% 可 以 看 出 ，swt2 所 小 波 分 解 同 样 不 改变 信号 的 长 上 度 ， 原 来 的 96x96 
的 图 

% 像 做 了 三 层 分 解 以 后 ， 分 解 系数 是 12 个 96x96 的 图 像 。 
colormap (map) 

kp=0; 

for 1=1:3 
subplot(3,4,kp+1),image(wcodemat(swa(:,:,1),192)); 
title(['Approx,cfs,level',num2str(i)]) 

% ші ОЛА Ч, 1926 У bF hH 
ѕибр101(3,4,Ккр+2) ,ітаре(мсодета (ѕмһ(:, :,1),192)); 
title(['Horiz.Det.cfs level',num2str(i)]) 
subplot(3,4,kp+3),image(wcodemat(swv(:,:,1),192)); 
title(['Vert.Det.cfs level',num2str(i)]) 
subplot(3,4,Kkp+4),image(wcodemat(swd(:,:,i),192)); 

title(['Diag.Det.cfs level' ,num2str(i)]) 

kp=kp+4; 

епа % 图 像 分 解 结束 


% 图 像 重 构 


load noiswom 
[swa,swh,swv,swd]=swt2(X,3,'db1'); 


% 使 用 db1 小 波 对 noiswom 图 像 进行 三 层 小 波 分 解 
mzero=zeros(size(swd)); 
A=mzero; 


A(:,:,3)=iswt2(swa,mzero,mzero,mzero, 'db1'); 


% 使 用 iswt2 的 滤波 髓 功能 ， 重 建 第 3 层 的 近似 系数 ， 为 了 避 例 1swt 
的 合 

% 成 运算 ， 注 意 在 重建 过 程 中 ， 应 保证 其 他 各 项 系数 为 去 
H=mzero;V=mzero;D=mzero; 

for i=1;3 

swcfs=mzero;swcfs(:,:,i)=swh(:,:,1); 
H(:,:,i)=iswt2(mzero,swcfs,mzero,mzero, 'db1'); 
swcfs=mzero;swcfs(:,:,i)=swv(:,:,i); 
V(:,:,i)=iswt2(mzero,mzero,swcfs,mzero, 'db1'); 
swcfs=mzero;swcfs(:,:,i)=swh(:,:,i); 
H(:,:,i)=iswt2(mzero,mzero,mzero,swcfs,'db1'); 
end 


% 分 别 重建 1~3 级 的 各 个 细节 系数 ， 同 样 在 重建 某 一 吸收 的 时 候 ， 要 
人 其 他 系数 为 6 

АС 2 БАС УЗЕН 3 тү s 35) 3DCu узу 
А(:,:,1)=А(:,:,2)+Н(:,:,2)+№(:,:,2)+0(:,:,2); 


% 使 用 递 推 的 方法 建立 第 1 层 和 第 2 层 近似 系数 

colormap(map) 

kp=0; 

for i=1:3 
subplot(3,4,kp+1),image(wcodemat(A(:,:,i),192)); 
title([ 第 "',num2str(i)， 层 近似 系数 图 像 ' ] ，fontsize' ,6) 
subplot(3,4,kp+2),image(wcodemat(H(:,:,i),192)); 
title([ 第 ',num2str(i)， 层 水 平 细节 系数 图 像 '] 'fontsize',6 
) 

subplot(3,4,kp+3),image(wcodemat(V(:,:,i),192)); 
title([' 第 ' ,num2str(i), ' 层 竖 直 细节 系数 图 像 '],'fontsize',6 
) 

subplot(3,4,kp+4),image(wcodemat(D(:,:,i),192)); 
title([' 第 ' ,num2str(i)， 层 对 角 细 节 系 数 图 像 '] ，'fontsize' ,6 
) 


kp=kp+4; 
end 


显示 的 结果 如 图 7.15 和 图 7.16 所 示 ， 由 于 分 解 
过 程 中 没有 改变 言 写 的 长 上 度 ， 所 以 在 显示 近似 和 细 
节 系 数 时 不 需要 重建 。 


Approx,cfs levell Horiz. Det.cts levell Vert.Det.cts levell Diag.Det.cts levell 





20 40 60 80 20 40 60 80 20 40 60 80 20 40 60 80 
Approx.cts level2 Hortz. Det.cts level2 Vert. Det.cfs level2 Diag. Det.cts level2 





20 40 60 80 20 40 60 80 20 40 60 80 20 40 60 80 
Approx,cfs level3 Horiz. Det.cfs level3 Vert. Det.cfs level3 Diag. Det.cfs level3 





20 40 60 80 20 40 60 80 20 40 60 80 20 40 60 80 


7.15 ”利用 db1 小 流 进行 图 像 分 解 


第 1 层 近似 系数 图 像 ”第 1 层 水 平 细节 系数 图 像 第 1 层 竖 直 细 节 系 数 图 像 第 1 层 对 角 细 节 系 数 图 像 
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第 2 层 近似 系数 图 像 ”第 2 层 水 平 细节 系数 图 像 ”第 2 层 竖 直 细 节 系 数 图 像 第 2 层 对 角 细 节 系 数 图 像 
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第 3 层 近似 系数 图 像 ” 第 3 层 水 平 细节 系数 图 像 第 3 层 竖 直 细节 系数 图 像 第 3 层 对 角 细 节 系 数 图 像 
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7.16 ”利用 db1 小 波 对 图 像 进行 各 级 静态 小 波 重 建 
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一 维 情况 下 的 小 波 理 论 共 有 了 丰富 的 成 果 ， 

于 小 波 变 换 的 多 分 辩 京 分 析 ， 可 以 知道 4 Ne 

际 上 需要 对 滤波 后 的 信号 进行 抽样 ， 而 重建 过 程 需 

要 对 子 市 信号 进行 插 信 再 滤波 。 对 于 一 维 信 号 ， 这 
茯 抽 样 与 插值 较 容 多 实现 ， 但 对 于 二 维和 多 维 情 形 
束 复 杂 得 多 。 由 于 对 多 维 信号 的 抽样 ， 实 际 上 十 对 


输入 样本 的 下 标 进行 处 理 ， 你 留 部 分 样本 输出 ， 一 
般 下 标 处 理 是 用 一 个 抽样 窍 阵 来 实现 的 ， 即 


(K)==(D . K), K € Z° 
(7-34) 
其 中 : x 为 输入 信号 ，y 为 输出 信号 ， 


НЕ ЕЮ 的 行列 式 的 绝对 值 |det(D )=N ， 表 
IMER, БИЖ EN 个 输入 样本 中 抽取 一 个 样本 作 
为 输出 。 在 不 分 离 的 多 分 辨 率 分 析 中 ， 抽 样 窍 阵 为 
对 角 阵 用 各 维 的 特征 值 均 相 等 ， 即 p-=2r ， 其 中 2 为 
维 数 ，T 为 二 维 单 位 矩阵 。 


多 维 多 分 辩 率 分 析 中 ， 三 维 多 分 辨识 分 析 走 最 
具有 有 实用 意义 的 ， 这 不 仪 因为 三 维 信息 能 为 读者 认 
识 的 安 观 或 做 观 各 体 皖 供 真实 的 人 质料， 而 且 该 痢 每 
天 都 面 对 关 量 的 三 维 信 筷 加 工 处 理 。 节 典型 的 三 维 
Пале РТВ. 


(1) 关于 时 间 轴 的 视频 信号 或 图 像 友 列 ， 每 
村 图 像 的 时 空间 是 二 维 的 ， 而 各 帆 图 像 之 间 的 关系 
是 时 序 的 ;对 访 类 三 维 图 像 处 理 的 目的 ， 通 第 是 对 
客体 的 运动 轨迹 和 运动 速度 做 出 估计 ， 或 进行 序列 
镜像 的 压缩 存储 和 传输 。 


(2) 天 于 z ШУЙ: pk ЕККУ, Д 
医用 和 工业 用 CT 或 医用 MR 等 成 像 设备 ， 它 的 每 帧 
图 像 古 空间 二 维 有 的 ， 而 各 帆 图 像 之 则 的 关系 天 于 z 
轴 是 序列 的 ， 是 真正 的 三 维 图 像 ， 比 时 间 序 列 的 三 
ERRER REZ. HZR =R H H, 
ле ЗТЯ AIZEA КУГА, 
skay ЭПКЕ FR 3846 Б ТЕЙ о 


0108, ЯЕ Н, TE СЛ) 
与 时 间 维 (一 维 ) КРЕ ЕВЕ, лен] РДА 
来 进行 多 分 辨 座 分 析 的 ， 而 真 三 维 的 图 候 原 则 上 难 
UDA. NE EHA E A EAST A 
像 ， 不 管 是 每 帧 图 像 〈 二 维 ) 还 是 序列 图 像 (三 
维 ) ， 孝 当 作 可 分 离 情 形 来 处 理 ， 实 际 上 均 能 取得 
满意 的 结 坟 ， 这 不 为 读 痢 的 工作 市 来 极 大 的 便利 。 


既 欠 三 维 序列 图 像 ， 不 管 哪 一 种 情形 ， 都 认为 
征 可 分 离 的 ， 则 可 以 用 分 解 民 图 给 出 其 中 一 级 的 多 
ЛЭН Т o 


(1) 关于 z WZT IBR — 25 Z 77924 
分 析 ， 如 图 7.17 所 示 。 


(2) 关于 t 轴 的 三 维 序列 图 像 的 一 级 多 分 辨认 
分 析 ， 如 图 7.18 所 示 。 





47.17 关于 z 轴 可 分 离 三 维 多 分 辨 率 分 析 〈 一 级 ) 
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关于 t 的 
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图 7.18 ”关于 上 轴 可 分 离 三 维 多 分 辨 率 分 析 (一 级 ) 


对 有 限 序 列 信号 flen) e PR х 0),0= t, ТЕЙ] 
于 空间 厅 列 她 be: er 0) 中 满足 7.1 太 中 提 到 的 多 
分 辩 率 分 析 的 定义 的 5 条 性 奈 ， 束 说 明子 空间 序列 


{Vi}je: Є L2(R2 x 0)| 


EDZESEN EN. IIRA, 6 
ДЕ R JE РЁ Z 
plr. y, 0) = ф(2)013)Ф(0). Уј € Z 


其 平移 系 


4 4 4 а L 3 
的 Ку. ka, ks == [Pik b; k Pi kalki е ka. ka = КЛ ! 


构成 的 标准 正 交 基 。 


它 的 8 个 三 维 小 波 函 数 如 下 。 


2\1) = ó(z)ó[i) (0) 


rry! А “о г о f m" 
p“) = ф(т)ф(у)ф(Ө@Ө) 
ol = (z )ó wn 
т "i у, B, P 
D ld) _ hAl r] E 1ф 9) 
Y i Y, p. r 
gp 一 四 (T) 让 [ у) 由 | 9) 
®© — ¿(z)é(u)a (B) 
Y — ч" ^ ү Y, Э <. 


pY = ó[(z)ó(u)ó(B) 


(8) 一 ф(х) Фу) Ф(Ө) 
它们 的 伸缩 平移 系 为 : 


Саға) k l,m € Za = 1,2,--- ,8) 


构成 PE х ө) КИЕ ТЕЗЕ, КИЛ 
一 表述 。 


85 ”图像 复 原 


图 像 复 原 和 是 图 像 处 理 重 要 的 研究 领域 。 在 成 像 
过 程 中 ， 由 于 成 像 系统 各 种 因 系 的 影响 ， 可 能 使 获 
租 的 图 像 不 是 真实 尿 物 的 完善 影像 。 图 像 在 形成 、 
传播 和 你 存 过程 中 使 图 像 质 量 下 降 的 过 程 ， 称 为 图 
傈 退化 。 图 像 复 原 束 是 重建 退化 的 图 像 ， 使 其 最 大 
眼 度 恢复 景物 原貌 的 处 理 。 


图 像 复 原 的 概念 与 图 像 增 强 相 似 。 但 图 像 增强 
可 以 针对 本 来 完善 的 图 像 ， 经 过 未 一 处 理 ， 使 其 适 
合 于 未 种 特定 的 应 用 ， 征 一 个 主观 的 过 程 。 图 像 复 
原 的 目的 也 古 改 善 图 像 质量 ， 但 图 像 复 原 更 侦 癌 于 
利用 退化 过 程 的 先 验 知识 使 已 被 人 退化 的 图 像 恢复 本 
来 面目 ， 更 多 的 古 一 个 客观 过 程 。 引 起 图 像 退化 的 
нб т. задел ЈЕ ИЧ, DA 
ДЕЙЛ Н ВЭ НБ аА, BARRET 
图 像 退 化 的 数学 模型 ， 复原 的 万 法 也 建立 在 比较 严 
格 的 数学 推导 上 。 部 分 复原 技术 已 经 在 空域 公 陈 化 
了 ， 可 以 方便 地 套用 ; 而 为 一 些 技术 则 适用 于 频 
域 。 本 章 将 从 理论 推导 和 实际 使 用 两 方面 介绍 不 同 
的 图 像 复原 技术 。 


本 章 的 知识 和 扩 术 热 操 


图 像 复原 的 基本 原理 

典型 噪声 及 空域 滤波 技术 

WIER Ji bae 

ДЕЕ Ы БЕЊ 

有 约束 最 小 二 乘法 复原 技术 
(6) Lucky-Richardson 复 原 技 术 
(7) НАННЯ К 

本 章 的 典型 案例 分 析 


去 除 照 厂 中 的 运动 模糊 


81 ”图像 复 原 的 理论 模型 


图 像 复 原 融 是 对 退化 过 程 建 模 ， 并 采用 祖 反 的 
过 程 进行 处 理 ， 以 便 恢复 原 图 像 。 图 像 复 原 拉 术 有 有 
看 严格 的 理论 基础 。 本 下 春 重 介绍 图 像 复原 的 基本 
概 你 及 其 与 图 像 增强 的 区 列 ， 还 将 涉及 图 像 复原 的 
过 程 模 型 以 及 第 见 的 噪声 模型 。 


Ë 


(1 


Ë 


(2 


Ë 


(3 
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(4 


Ë 


(5 


8.11 图 像 复原 的 基本 概念 


图 像 复原 的 前 近 古 图 像 人 退化， 图像 退 化 十指 图 
像 在 形成 、 记 录 、 处 理 、 传 输 过 程 中 由 于 成 像 系 
统 、 记 录 设 备 、 处 理 方 法 和 传输 介质 的 不 完善 ， 导 
致 的 图 优质 量 下 降 。 有 其 体 来 况 ， 币 见 的 退化 原因 大 
致 有 : 成 像 系 统 的 像 兰 或 有 限 扎 径 或 存在 衍射 成 
ЖАНА; 成 像 系统 与 景物 的 相对 运动 ДЕЛ 
感光 特性 曲线 的 非 线 性 ;显示 器 显示 时 的 失真 ; 遥 
感 成 像 中 的 大气 散 射 和 六 气 扰动 ， 避 感 摄 像 机 的 运 
动 和 扫描 速度 不 稳定 ， 系 统 各 个 环 世 的 噪声 干扰 ; 
模拟 图 像 数 字 化 引入 的 误差 等 。 


图 像 复 原 与 第 5 章 介 绍 的 图 像 增强 相似 ， 两 者 
都 是 要 得 到 在 某 种 意义 上 改进 的 图 像 ， 或 者 说 ， 希 
望 改 进 输 入 图 像 的 质量 。 两 者 的 不 同 之 处 是 图 像 增 
强 撤 术 一 般 要 信 助 人 的 视 党 系统 的 特性 ， 以 取得 较 
оннан 

п, 8.15 0818 р И, Aru КРА 


景 : OA ЛАА: @ 想 要 看 清 便 币 上 的 
头像 和 字母 。 





图 8.1 тИ 


(1) 如 未 需要 计算 便 币 履 震 的 面积 ， 则 需要 
自 完 对 图 像 做 二 值 化 处 理 ， 再 统计 图 像 中 黑色 像 系 
扩 的 个 数 。 


二 值 化 后 的 图 像 如 图 8.2 所 示 。 二 值 化 后 再 使 用 
数学 形态 学 人 处理， 使 整个 硬币 均 显 示 为 黑色 ， 如 图 
8.3 所 不 。 





图 8.2 EKES 


图 8.3 ”数学 形态 学 处 理 后 的 图 像 
(2) 如 未 想 要 看 清 使 币 上 的 字母 和 头像 ， 则 


可 以 对 图 8.4 做 增 大 对 比 度 的 处 理 ， 结 末 如 图 8.4 所 
ZR o 








图 8.4” 增 大 对 比 度 


可 见 ， 出 于 不 同 的 目的 ， 可 对 图 像 做 不 同 的 增 
玛 处 理 。 图 像 增 强 的 目标 是 多 样 的 。 而 图 像 复 原则 
认为 图 像 在 东 种 情况 下 退化 或 恶化 了 ， 使 得 图 像 品 
质 出 现下 降 ， 现 在 需要 根据 相应 的 退化 模型 和 知识 
重建 或 恢复 原始 的 图 像 。 因 此 ， 图 像 复原 的 目标 征 
原始 的 反应 中 实物 体 或 场景 的 图 像 ， 这 十 和 客观 存在 
的 ， 不 以 主观 意 忘 为 转移 。 图 像 复 原 通过 概率 估计 
或 完 验 知 识 干 方 白 计 地 去 还 原 图 像 的 本 来 面貌 。 


假设 图 8.4 所 示 的 网 像 由 于 某 种 原因 受到 了 椒盐 
emmy% 148.507. 





48.5 ”椒盐 噪声 污染 的 硬币 网 像 


此 时 需要 恢复 访 图 像 的 本 来 面 驶 《〈 见 图 8.1) ， 
采用 中 值 滤 妆 的 方法 ， 得 出 如 向 8.6 所 示 的 复原 续 
Ж. 





图 8.6 RIPAR 


与 图 像 增强 的 多 目的 性 不 同 ， 图 像 复 原 的 客观 
目标 束 是 恢复 如 图 8.1 所 示 的 原始 图 像 。 中 值 滤 激 的 
方法 基本 去 除了 图 像 中 的 墨 日 噪声 点 ， 但 与 原 图 相 
比 ， 图 像 也 出 现 了 一 定 程 度 的 模糊 。 图 像 复原 只 能 
尽量 使 图 像 接近 其 原始 图 像 ， 但 由 于 噪声 、 干 扰 等 
KHR, RIETS MLE SE o 


8.1.2 Яну B a Zt 


АЯГАН а, AKHA A. 1 
271528 H] Р БАА БЫШ)» ШИН], HH 
于 这 种 方法 试图 估计 图 像 被 一些 相对 民 性 的 退化 过 
程 影 啊 以 二 的 情况 ， 政 十 一 种 估计 方法 。 


给 出 一 幅 退 化 图 像 ， 如 果 已 知 其 退化 的 过 程 信 
晨 ， 那 么 对 图 像 执 行 该 过 程 的 逆 操 作 即 可 恢复 图 


Ж. ERARA ZJ, 1 Н] АСЕРЛИ НЕШ Ж] Л, 
个 参数 进行 估计 即 可 ， 此 时 复原 变 为 一 个 检测 问 

题 。 假 如 退化 的 过 程 不 可 知 或 无 法 精确 获得 ， 则 可 
对 退化 过 程 〈 模 糊 和 噪声 ) 建立 异型， 进行 折 述 ， 
并 进而 寻找 一 种 去 除 或 前 弦 其 影响 的 过 程 。 


一 般 将 网 像 的 退化 过 程 模型 化 为 一 个 退化 函数 
和 一 个 加 性 噪声 项 。 设 原始 输入 图 像 为 few ， 退 化 
RAe), DERE nea), PEREKBEN A 
(ra), RIR a ЕЧ JR ЧИК Уу ev) 。 退 化 和 
复原 过 程 如 图 8.7 所 示 。 





图 8.7” 退 化、 复原 过 程 


如 来 系统 H 是 一 个 线性 、 位 置 不 变性 的 过 程 ， 
那么 在 空间 域 中 给 出 的 退化 图 像 可 由 下 式 给 出 : 


giz, у) = hlr, y) * f(r y) 十 nlr, уу) 
(8-1) 


其 中 (*) 表 示 空 间 卷 积 。 由 数字 信号 处 理 的 知识 


可 知 ， 空 域 卷 积 在 频 域 上 可 用 乘积 表示 ， 因 此 上 式 
等 价 于 以 下 的 频 域 表达 式 : 


Glu, v) = Hlu.u)F(u.u) + N(u,v) 
(8-2) 


在 进行 图 像 复原 时 既 可 以 在 空间 域 ， 也 可 以 在 
频 域 中 进行 ， 根 据 具 体 问 题 采 用 方便 有 效 的 一 种 方 
式 即 可 。 罕 间 域 的 处 理 使 用 知 积 ， 频 域 的 处 理 使 用 
相 来 实现 。 


8.2 ”噪声 模型 


图 像 的 退化 往往 伴随 着 噪声 。 另 外 ， 在 部 分 场 
景 下 唯一 的 退化 就 是 噪声 。 此 时 图 像 复 原 与 图 像 增 
强 所 做 的 处 理 几 乎 不 可 区 分 。 噪 声 主要 来 源 于 图 像 
的 获取 和 传输 过 程 。 


(1) 图 像 传 感 锅 的 工作 情况 受 各 种 因 妹 的 影 
啊 ， 如 图 像 获 取 中 的 环境 条 件 和 传 感 元 右 件 目 身 的 
质量 。 例 如 ， 当 使 用 CCD 摄 像 机 获取 图 像 时 ， 光 照 
强度 和 传感器 的 远 度 是 生成 图 像 中 产生 大 量 噪声 的 
ЕЕ. 


(2) 图 像 在 传输 过 程 中 主要 由 于 所 用 传输 信 


道 被 干扰 而 受到 噪声 污染 。 比 如 ， 通 过 无 线 网 络 传 
输 的 图 像 可 能 会 因为 光 或 其 他 大 气 因素 的 干扰 被 污 


Ио 


高 斯 噪声 是 理论 研究 中 最 常见 的 噪声 。 一 般 而 
言 ， 对 一 个 抗 噪 系统 而 言 高 斯 噪声 是 最 恶劣 的 吧 
声 ， 设 计 系统 时 只 要 能 够 抵抗 高 斯 噪声 ， 那 么 系统 
性 能 就 有 保证 。 


局 斯 噪声 也 十 现实 生活 中 极为 闸 见 的 。 根 据 中 
心 极 限定 理 ， 和 在 目 然 办 中 ， 一 些 现象 受到 许多 相互 
独立 的 随机 因 妹 的 影响 ， 如 末 每 个 因 系 所 产生 的 影 
ч шша JZ НА nj АЧЕХ ЛЛА 1627 


局 斯 随机 变量 z 的 概率 密度 函数 由 下 却 给 出 : 





р(2) = 
(8-3) 


其 中 ，z RRE, и 表示 z PERAE 


(9, о 表示 z 的 标准 差 。 标 准 差 的 平方 o? 称 为 z 的 广 


28, 

2. ЖЛ Ера 
ЕЛЬ Я аср А jh ani, A 

着 相同 的 方差 的 正 态 分 布 时 ， 这 个 同 量 的 模 呈 瑞 利 


分 布 。 服 从 这 种 分 布 的 噪声 即 瑞 利 噪声 ， 其 概率 密 
БЕ РА ЖЕН Роан 


о са 
(8-4) 
概率 密度 的 均值 为 : 
н = a+ Vpb/4 
(8-5) 


(8-6) 


3. (ПЕЕ рч 


ДЕ ЛЛ ITAR НЕЕ pa О Е Б а, MAAR ЕН 
ЛАХ ВОНИ KEBEN. AE ERA Р 
7 H: 


(8-7) 
Н.Ж ЕШ Ы{ЕЛП Л Æ H 
h 
H= m 
(8-8) 
和 
(8-9) 
25. 


4. ЗШЕ Р 


Та 2 ba si УЛИ ЖЕ БЕ А Жн] H 25 Eh: 


Єў [ает т Z= Ü 
Р lo z<0 


(8-10) 
其 中 ，a> 0。 概 率 密度 函数 的 期 望 值 和 方差 是 


(8-11) 
和 


(8-12) 


指数 分 布 的 概率 密度 函数 是 当 b = (ШИИ ЖЕ 35 2 У КЕЧ 
况 。 
5. 均匀 分 布 噪声 


均匀 分 布 噪声 的 概 座 密 度 可 由 下 却 给 出 : 


(8-13) 


МИ ЖЕ 067 БЕ РА АЯЛ ЗЛА 27 ЖЕНЕН Кон: 





(8-14) 


和 





(8-15) 


6. КТР ОЙДЕ") 


(KO ВК FE HIWA A БЕ РАЖ н] H 202 


出 : 
Р, 2 =а 
р(2) =}р, = b 
0 其 他 





(8-16) 


如 果 >a ， 则 灰 度 值 b 在 图 像 中 将 显示 为 一 个 
亮点 ， 反 之 则 a 的 值 将 显示 为 一 个 瞳 点 。 若 P。 或 Pb 
其 中 之 一 为 零 ， 则 脉冲 噪声 称 为 单 极 脉冲 。 如 果 P。 
和 Pb 均 不 为 零 ， 尤 其 是 它们 近似 相等 时 ， 则 脉冲 噪 
声 值 将 类 似 于 随机 分 布 在 图 像 上 的 胡椒 和 盐 粉 和 
粒 ， 故 称 为 椒盐 噪声 。 


椒盐 噪声 是 视觉 上 最 为 明显 的 一 种 噪声 ， 噪 声 
脉冲 可 以 是 正 的 ， 也 可 以 是 负 的 ， 


以 上 介绍 的 各 种 噪声 可 以 用 于 对 实际 当中 的 图 
ВоВ. ЕИ, тарт АЧ) 
HE T EB A ER а ТЕНИ АЯ НН ER тетїш тү ЖИЕК be 
Р. mA Е ЕТ. ЕРУ RE EH IER Н ЖИ ЯУ 
FEAH ЗА Е ТИЕ A ЗЕ ИП Е ЭЕ ВК 
像 中 有 一 些 应 用 。 椒 起 噪声 主要 表现 在 成 像 中 的 短 
革 停 留 ， 例 如 铬 误 的 开关 操作 。 均 匀 分 布 定 实践 中 
出 现 得 最 少 的 噪声 ， 但 可 以 根据 均匀 噪声 产生 其 他 


噪声 。 
【 例 8.1】 用 MATLAB 绘 制 噪声 的 概率 密度 
根据 以 上 几 种 噪声 的 分 布 原理 ， 用 函数 


show_noise_pdfO = Æ P EE Л 2037 ра 5, MF 
MEA“ chapter8/code” Е F 


的 “show_noise_pdf.m>” 文 件 中 ， 诅 函数 的 退回 住 可 
以 用 来 绘制 概 康 密度 函数 曲线 图 。 函 数 代 人 码 如 下 。 


function Y = show noise pdf(type, x, a, b) 
show_noise_pdf 显示 不 同 噪声 的 概率 密度 函数 . 
type: FFP, HUE PE bk E PRM E 


高 斯 噪声 : gaussian， 参 数 为 (x,y)， 默 认 值 为 (6,16) 
Ji IE уз; rayleigh， 人 参数 为 Xx， 默 认 信 为 36 


Ile y : gamma， 人 参数 为 (x,y)，, 默 认 值 为 (2,16) 

TR AUER i, exp， 参 数 为 x, 默认 值 为 15 

均匀 分 布 : uniform， 参 数 为 (x,y)， 默 认 值 为 (-20,20) 
椒盐 噪声 : salt & pepper: 2х, SKT B 770.02 
example: 

x=0:.1:10; 

Y=show_noise pdf('gamma',2,5,x); 

plot(x,Y) 


SS NAN 585 55 585 55 55 šS 55 55 XN 


% 设置 默认 噪声 类 型 

1f nargin == 1 
type='gaussian'; 

end 


% 开始 处 理 
switch lower(type) 
бте УЛ БЕН НК ТЕ Ou 
case 'gaussian' 
1f nargin<4 
b=10; 
end 
1f nargin <3 
a=0; 
end 
Y=normpdf(x,a,b); 


% 均 匀 品 再 的 情况 
case 'uniform' 

1f nargin<4 
b=20; 

end 

1f nargin <3 
a=-20; 

end 

Y=unifpdf(x,a,b); 


БЛ R ba E АЈ УУ, 
case 'salt & реррег' 


% 11 Н ітпоіѕер 
Ү=2егоѕ (5іғе(х)); 
Ү(1)=0.5; 
Ү(епа)=ө.5; 


% 瑞 利 噪 声 的 情况 
case 'rayleigh' 
1f nargin < 3 
a = 30; 
end 
Y=raylpdf (x,a); 


% 指 数 噪声 的 情况 


case 'exp' 
1f nargin < 3 
a = 15; 
end 


Y=exppdf (x,a); 


ШЕЕ УА ШЕР 
case “gamma ' 
1f nargin <4 


b=10; 
end 
if nargin<3 
a=2; 
end 
Y=gampdf(x,a,b); 


otherwise 
error('Unknown distribution type.') 
end 





在 MATLAB 命 令 窗口 输入 命令 绘制 概率 密度 
图 ， 结 果 如 图 8.8 所 示 。 


Figure 1 


File Edit View Insert Tools Desktop Window Help 


>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 





8.8 ЖЖ р 





Х=-4:.1:4; 

subplot(321) 

Y1=show_noise pdf('gaussian',x, Ө, 1); 
plot(x,Y1); 

title(' 高 斯 '); 

subplot (322) 

Y2=show noise pdf('uniform',x, -3, 3); 
plot(x,Y2); 

title(' 均 匀 '); 


>> subplot(323) 

>> ҮЗ=5һом _ noise pdf('salt & pepper',x); 
>> plot(x,Y3); 

>> title( ' 概 盐 ' ); 

>> subplot(324) 

>> Ү4=5һом _ noise pdf('rayleigh',x,1); 
>> plot(x,Y4); 

>> title(' 瑞 利 '); 

>> subplot(325) 

>> Y5=show noise pdf('exp',x,1); 

>> plot(x,Y5); 

>> title(' 指 数 '); 

>> subplot(326) 

>> Y6=show поіѕе pdf('gamma' ,x,2,5); 
>> plot(x,Y6); 

>> title( ' 伽 玛 ' ); 


8.22 MATLAB 实 现 


МАТГІАВ [Ж J WIER ДЧ РЁ Zrimnoise(0), fH 
ІН ВЕЗЛІ) i. ale Н МУН) JL Rh р. 
TEX E fE H] H Е Хр ааа noise() 7 ИЛЕ 
声 ， 位 于 配套 光盘 “chapter8/code/ 路 径 下 
的 “add_noise.m2” 文 件 中 ， 能 够 实现 局 斯 噪声 、 瑞 利 
噪声 、 伽 玛 噪 声 、 指 数 噪声 、 椒 盐 噪 声 和 均 勾 噪声 
的 浴 加 。 


调用 格式 如 下 。 


IJ = add поіѕе(ї, type, x, y) 


1% РЕ ЭА] КЇТ УЛЭ Жлуре 的 噪声 ， 噪 声 
参数 为 x у. 


参数 说 明 : 
。1 为 输入 图 像 矩 阵 ， 规 定 为 灰 度 图 像 
° type 为 字符 串 ， 表 示 噪 声 闪 型 ， 可 取 的 信 为 
gaussian, rayleigh, gamma. exp. uniform#llsalt 
бс реррег. 
返回 值 : 
е ІЈ 为 添加 噪声 后 的 图 像 ， 大 小 与 I 一 致 。 


利用 MATLAB 增 加 噪声 的 相关 代码 如 下 。 





function IJ = ааа noise(I, type, x, y) 

add_noise KAH РР АЕ ВТА РТУ Л.Н ЕЕ ya у L ЖП. 
input: 

I: WARBER, УКВ 

type: “rh, ЖИВЕ m ARATI E 

高 斯 噪声 : gaussian， 人 参数 为 (Xx,y)， 默 认 值 为 (6,16) 
瑞 利 噪声 : rayleigh， 人 参数 为 X， 默 认 值 为 36 

Ile уз; gamma， 人 参数 为 (x,y)， 默 认 值 为 (2,16) 

% 指数 噪声 : exp， 参 数 为 x, 默认 值 为 15 

% 均匀 分 布 : uniform， 参 数 为 (x,y)， 默 认 值 为 (-26,26) 
% МБЕ : salt & pepper: 量度 为 X， 默 认 值 为 6.62 


SS éS N 585 55 oe 


output: 

IJ : ИЧЕ АЈ 

example: 

I=imread('a.bmp'); 

ІЈ=ааа noise(I,'salt & pepper',0.1); 
imshow(IJ) 


SS N N XN XN X 


SS 


о MANH 

if ndims(I)>=3 
I=rgb2gray( I); 

end 


[M,N]=size(1I); 


% 议 置 默认 噪声 类 型 
1f пагріп == 1 

type='gaussian'; 
end 


% 开始 处 理 
switch lower(type) 


теа R БЕН Н) Ou 
case 'gaussian' 
if nargin<4 
y=10; 
end 
1f nargin <3 
x=0; 
end 


% 产生 高 斯 分 布 随 机 数 
R = normrnd(x,y,M,N); 
IJ=double(I)+R; 
IJ=uint8(round(13J)); 


% 鬼 匀 噪 声 的 情况 
case 'uniform' 

1f nargin<4 
y=20; 

end 

1f nargin <3 
x=-20; 

end 


% 产生 均匀 分 布 随机 数 

R = unifrnd(x,y,M,N); 
IJ=double(I)+R; 
IJ=uint8(round(13J)); 


БЛ R be E J la Ou 
case 'salt & реррег' 
1f nargin < 3 

x= 0.02; 
end 


% 19 Н ітпоіѕер žk 
IJ=imnoise(I,'salt & реррег'", х); 


% 瑞 利 噪 声 的 情况 
case 'rayleigh' 
1f nargin < 3 
x = 30; 
end 


% 产生 瑞 利 分 布 随机 数 
R = raylrnd(x,M,N); 
IJ=double(I)+R; 
IJ=uint8(round(13J)); 


% 指 数 噪声 的 情况 


case 'exp' 
1f nargin < 3 
x = 15; 
end 


R=exprnd(x,M,N); 
IJ=double(I)+R; 
IJ=uint8(round(1IJ)); 


ШЕЕ УА Д-Р 
case ' ратта ' 

1f nargin <4 
y=10; 

end 

1f nargin<3 
х=2; 

епа 


R=gamrnd(x,y,M,N); 
IJ=double(I)+R; 
IJ=uint8(round(13J)); 
otherwise 
error('Unknown distribution type.') 
end 


在 MATLAB 命 令 窗 口中 调用 该 函数 为 图 像 添加 
噪声 ， 并 调用 MATLAB 自 市 函数 histO 绘 制 灰 度 直 
З. Ж К. 





>> I=imread('square.bmp'); 
>> J1 = ааа noise(I, 'раиѕѕіап', 0, 10); 
>> subplot(321) 


>> hist(double(J1(:)), 100) 

>> title(' 高 斯 '); 

>> subplot(322) 

>> J2 = add noise(I, 'uniform', -20, 20); 
>> hist(double(J2(:)), 100) 

>> title( ' 均 匀 '); 

>> subplot(323) 

>> J3 = add noise(I, 'salt & pepper',0.02); 
>> hist(double(J3(:)), 100) 

>> title(' 概 盐 ' ); 

>> subplot(324) 

>> J4 = ааа noise(I, 'rayleigh',30); 
>> hist(double(J4(:)), 100) 

>> title(' 瑞 利 ' ); 

>> subplot(325) 

>> J5 = add noise(I, 'exp',15); 

>> hist(double(J5(:)), 100) 

>> title( ' 指 数 " ) ; 

>> subplot(326) 

>> J6 = add noise(I, 'gamma',2,10); 
>> hist(double(J6(:)), 100) 

>> title('135'); 


square.bmp 古 256x256 灰 度 图 保 ， 图 像 中 只 有 灰 
度 值 为 100 和 150 的 像 系 。 原 始 图 像 如 图 8.9 所 示 ， 表 
加 高 斯 噪声 后 的 图 像 如 网 8.10 所 示 。 





图 8.9 ”原始 图 像 





8.10 т Ja ЈИ 


ХЕ л WEN АЗ 8.11577, AREN 
百 方 匈 与 理论 的 曲线 形状 一 致 。 
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8.11 实际 噪声 耳 方 图 
8.2.3 Visual C++ 实现 
以 下 给 出 了 添加 噪声 的 几 种 函数 。 
1. 均匀 噪声 


ИП) Jipa pa HI ра 2 J AddUniform(), ARIUN 
下 


/ KK K * * K * K K K K K K K * K * K K K K K K K K K XK * K K K 


void CImgProcess::AddUniform(CImgProcess *pTo) 
功能 : 对 图 像 添加 均匀 噪声 


参数 : 

CImgProcess *pTo: 得 出 的 图 像 指针 
返回 值 : 

A 


ETEF r Fp CET EER ЕТЕ КЕЕ ЕЕ TER 


void CImgProcess::AddUniform(CImgProcess *pTo) 
{ 

int w = m pBMIH->biWidth; 

int h = m pBMIH->biHeight; 

int i,j; 

double rate = 0.99; 

double a; 

double low=-20.0; 

double high=20.0; 

for (i=0; i<h; i++) 

{ 

for (j=0; j<w; j++) 


double t; 

t=double(rand()) / RAND MAX; 

if (t < rate) 

l 
a = double(rand()) / RAND_MAX; 
unsigned char ch = GetGray(j, i); 
a *= (high - low); 
a +=low; 
a += ch; 
int it = int(a+0.5); 


if (it<0) 
11=0; 
if (it>255) 
TU = 2555 
ch = пр 
pTo->SetPixel(j, i, RGB(ch,ch,ch)); 





ЖІН AddUniform() KZU INE 2J Б yi HJ 254914 
封 攻 在 DIPDemo 工 程 中 的 视图 美国 数 void 
CDIPDemoView:: OnAddUniformO 中 ， 其 中 调用 
АааОпіѓогт() A Z AJARA Jr Br F ИТК: 
CImgProcess imgOutput = imgInput; 
imglnput.AddUniform(&imgOutput); 


pDoc->m_ Image = imgOutput; 





ШҰ К. 


/ KK K * * K * K K K K K K K * K * K K K K K K K K K XK * K XK XK 


void CImgProcess::AddGaussian(CImgProcess *pTo) 


功能 : ХТА ИТЕ, HENE, 2722710 
参数 : 

CImgProcess *pTo: 输出 的 图 像 指 针 
返回 值 : 


人 


void CImgProcess: :AddGaussian(CImgProcess *pTo) 
{ 
int w=m_pBMIH->biWidth; 
int h = m pBMIH->biHeight; 
int i,j; 
double rate = 0.99; 
double sigma = 10.0; 
double а,а1,а2; 
for (i=0; i<h; i++) 
{ 
for (j=0; j<w; j++) 


double +; 
t=double(rand()) / RAND МАХ; 
1# (t < rate) 
{ 
al = double(rand()) / RAND_ МАХ; 
a2 = double(rand()) / RAND_ МАХ; 
а = log(al) * соѕ(2*РІ*а2); 
а *= sigma; 
unsigned char ch = GetGray(j, i); 
a += ch; 
int it = int(a+0.5); 
if (it<0) 
it=0; 
if (it>255) 
it = 255; 
ch = тр 
pTo->SetPixel(j, i, RGB(ch,ch,ch)); 





Ж АаасСаиѕѕіап() р 070 u АЕ pá НАЈ 2 1104 
封装 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView:: OnAddGaussian() 中 ， 其 中 调用 


АааСаиѕѕіап() РА 11У Br HH F ТУХ o 
СІтеРгосеѕѕ imgOutput = ImgInput ; 
imgInput.AddGaussian(&imgOutput ) ; 


pDoc->m Image = ImgOutput ; 





实现 添加 椒盐 噪声 的 函数 为 AddSalt_Pepper()， 
代码 如 下 。 





/ KK K * * K * K K K K K K K * K * K K K K K K K K K XK * K XK XK 


void CImgProcess::AddSalt_Pepper(CImgProcess *pTo) 
功能 : H ERASI N Ek R pa 


参数 : 
CImgProcess *pTo: 输出 的 图 像 指 针 
返回 值 : 


无 


和 
void CImgProcess: :Addsalt Pepper(CImgProcess *pTo) 
l 

int w = m pBMIH->biWidth; 

int h = m pBMIH->biHeight; 


int е 

double rate = 0.02; 
double a; 

for (i=0; i<h; i++) 
{ 


for (j=0; j<w; j++) 


double t; 
t=double(rand()) / RAND_MAX; 
1# (t < rate) 


a = double(rand()) / RAND_MAX; 
if (a < 0.5) 
pTo->SetPixel(j, i, RGB(0,0,0)); 
else 
pTo->SetPixel(j, i, RGB(255,255,255)); 


АН Аааѕак_ Реррег() р й 1 p Н) 
В 5 EDIPDemo С F ВА 4 2 pd уоіа 
CDIPDemoView:: OnAddSsaltO0 中 ， 其 中 调用 
AddSalt Реррег() K ZAJRA A т Ету. 


CImgProcess imgOutput = імеІпри+; 


imgInput.AddSalt Pepper(&imgOutput); 


pDoc->m Image = imgOutput; 





4. НЕ 


实现 添加 瑞 利 噪声 的 函数 为 AddRayleighO0， 代 
ШҰ F o 


/ * * * * * * * * * * K K * K * * * * * * K K * K K * * * * * * 


void CImgProcess::AddRayleigh(CImgProcess *pTo) 
功能 : 对 图 像 涩 加 瑞 利 噪声 


参数 : 

CImgProcess *pTo: 输出 的 图 像 指 针 
返回 值 : 

25 


о ааа 
void CImgProcess::AddRayleigh(CImgProcess *ртТо) 
l 
int w=m pBMIH->biWidth; 
int h = m pBMIH->biHeight; 
int i,j; 
double rate = 0.99; 
double sigma = 10.0; 
double a,a0,al,a2,a3; 
for (i=0; i<h; i++) 
{ 
for (j=0; j<w; j++) 
{ 
double t; 
t=double(rand()) / RAND_MAX; 


1# (t < rate) 


{ 
ад = double(rand()) / RAND МАХ; 
al = double(rand()) / КАМ№О МАХ; 
a2 = log(a90) * соѕ(2*РІ*а1); 
a3 = log(al) * соѕ(2*РІ*ае); 


а2 *= sigma; 
a3 *= sigma; 
а = sqrt(a2*a2 + a3*a3); 
unsigned char ch = GetGray(j, i); 
a += ch; 
int it = int(a+0.5); 
if (it<0) 
it=0; 
if (it>255) 
it = 255; 
ch = it; 
pTo->SetPixel(j, i, RGB(ch,ch,ch)); 


ХН Ааавау1еівћ() ра ACAS DN m A e E J JS ЇЙЇ 
ДЫ] Же +EDIPDemo T Н ВАА В 2 pa 25rvoid 
CDIPDemoView:: OnAddRayleighO 中 ， 其 中 调用 
AddRayleighO 函 数 的 代码 请 断 如 下 所 示 。 


CImgProcess imgOutput = ImgInput ; 


imgInput.AddRayleigh(&imgOutput); 


pDoc->m_ Image = imgOutput; 





谈 者 可 以 通过 ХЭБ нт PEET DIPDemot НІЖ 
ят 9 JE — 高 斯 噪声 ” “BAA JE -E 
噪声 ”“ 图 像 复 原 — 瑞 利 噪声 ”和 “图 像 复 原 ~ 均匀 
噪声 ”来 观察 处 理 效 末 。 使 用 square.bmp 作 为 汕 试图 
像 ， 深 加 4 种 噪声 后 的 效果 如 图 8.12 所 示 。 





(а) 均匀 噪声 Cb) виран со 椒盐 噪声 Cd) 瑞 利 噪声 
图 8.12 ПЕЧ 
r 
ЗАЈДЕ a r, ПШ В.т “ж. _, JK EF 


EJA SAB S bs ИНУ EL УТЕ, ИПЕ8.137Т 
示 。 


Do ale UL uU AUAU E l 1001503 AE AE 


(b) 高 斯 噪声 


DA E Üm = 520055 





(d) ЯР 


本 市 介绍 党 用 的 几 种 空域 小 波 方 法 ， 其 中 部 分 


方法 与 本 书 空域 增强 和 频 域 增强 的 草 廊 中 的 部 分 内 
容 相 同 ， 在 这 里 就 不 再 详细 介绍 了 ， 在 这 里 给 出 自 
适应 均值 小 流 的 实现 。 


8.3.1 ”空域 滤波 原理 


当 在 一 幅 图 像 中 唯一 存在 的 退化 是 噪声 时 ， 吧 
ра ha ДУ н] 以 用 FEKA: 
(т, у) = Finy) +-т(т,у) 
(8-17) 
和 
Glu, 划一 及 (十 WU 
(8-18) 
如 果 存 在 周期 噪声 ， 通 常 可 以 从 G (u v ) 频 谱 
中 将 周期 噪声 减弱 ， 再 还 原 到 时 域 。 但 一 般 情况 下 
噪声 者 采用 空域 滤波 的 方式 处 理 。 
1. 均值 滤波 大 


在 图 像 增 踢 一 章 中 己 有 所 介绍 。 对 竺 处 理 的 像 
系 给 定 一 个 模板 ， 访 模板 包括 了 其 周围 的 邻近 候 
ж. ШЛ ЕЈ ИИ АИА ИАА ЖИ 


值 的 方法 就 是 均值 滤波 。 它 主要 包括 算术 均值 滤 
波 、 几 何 均值 滤波 、 谐 波 均值 滤波 以 及 逆 谐 波 均值 
VEW o WIJE VELARA] I HRI A BT HIAR o 


2. ЕЛЕС й 
VL TE Е а сн АУ [ЖЕНЕ ЇН йй, 
н] РАЯ НАЕМЕ REZILA в KB ви 
ЛА а. ЧЕ O is SP o 
3. Ахл j HEER pa ҮН BR VE YX wš 
DA Ете ЖН УЙЕ ЙУ йа ЛЛК] РАА rH НУЛА 
ЮЖ ARITA EERIE, Е, ЕЕЕ Р НУН 
时， 也 为 原 有 图 像 带 来 了 模糊 和 失真 。 自 适应 滤波 
и НВР И АУТ ЕБ АЕ ВЕ о 
假设 滤波 器 作用 于 局 部 区 域 Ss ， 采 用 以 下 4 个 
量 进 行 计算 。 
(1) glz): BZ A(x ‚У AE PIRE o 
(2) à: EAN o 


(3) mr : 局 部 均值 ， 即 模板 尺度 Sy 内 各 像 
素 点 的 均值 。 


(4) 4: 局 部 方差 。Sw 内 像素 点 的 方差 

VEAST LA FEUM IT 

(1) 279 NE, MAHIR Elg (x ,y )ҤИЙ#< 

(2) #rs Is EEI, Б |01 g (x ,у ) 的 
近似 值 。 A e шша ынды 人 
役 情 况 下 边 绿 应 要 保留 


(3) 石 半 与 总 相等 ， 则 返回 mr 。 局 部 面积 与 
全 局 面积 有 相同 特性 ， 去 除 局 部 噪声 可 利用 求 均值 
来 降低 。 


沽 中 上 和 面 要 求 的 表达 式 可 以 与 为 : 
f (т,у) = g (T, у) — = [д{т,у) — mz] 
(8-19) 


除了 以 外 ， 其 余 量 均 与 局 部 像 系 相关 。 总 无 
法 获得 准确 值 ， 一 般 采 用 估计 的 方法 得 到 . 


4. Hun HB 78 Бї #š 
HB ЕУ ЖЕНИ ЖЕН pa ВУ А АЕ Ш-ДА Ж. 


“анун ВЕЛЕ КИ Н] Ple Ж ЙЕ а, 1H 

IB f(E ШЙ, HRE AE EBRR Т. 

ЕЛУ H 89822 а н] PAK 3 Rb Af ESA H И > 
采用 以 下 几 个 变量 进行 计算 。 


(1) soo=nin(ss) ， 即 模板 窗口 内 像素 的 最 小 
i. 


(2) sa = шах (8), RERI i O ARRIRA 
值 。 


(3) sma=me(sw) ， 即 模板 窗口 内 像素 的 中 值 。 
(4) ду, ФОХ y ) 处 的 灰 度 像素 值 。 

(5) S max ， 标 量 值 ，Sw 允许 的 最 大 尺寸 
自 适 应 中 值 滤波 分 为 两 个 步骤 ， 记 为 步骤 A 和 


步骤 B。 


步 又 A: 


LA 12 ОНА 5 < 0, 转 到 也 


EUSK A ORSI 
H A ORF<Snx: ERA 


合 则 输出 zxy 


УВ: 


Bı = ry — min 


Бу = z; у — max 
++ AN 
若 B1>0 且 B 2，<0， 输 出 zxy 
含 则 输出 z med 


ож KUN FS max Же ТЕЗЕП Ж, А 
Ра УЖ ЛЕЙ ДА, ZABALA AHS K. ШИ ЕЗЙ] 
以 看 出 ， 算 法 经 过 了 层 层 判断 后 才 用 窗口 的 中 值 代 
从 原 像 系 值 ， 主 多 判断 分 文部 最 终 及 用 了 原 像 系 值 
VEINI HARE, ERRAT t RTT o 


8.3.2 MATLAB 实 现 
在 这 里 使 用 自 定义 函数 adp_median0 实 现 自 适 


应 中 值 沽 波 ， 位 于 配套 光盘 “chapter8/code/” 路 径 下 
的 “adp_median.m>” 文 件 中 。 


ЖН АН F o 
II = adp_median(I, Smax) 


ХИЧ Мт Н ЛЕУ rH НЕЙМ, RER 


О 


参数 说 明 : 
° ІУ Л ИНЕ; 
° Smax HEIKKA РА МЗхЗ O Fin, — 
В E Smax xSmax 。 
返回 值 : 
• П 为 涛 小 后 的 儿 像 ， 大 小 与 I 一 致 。 


利用 MATLAB 实 现 目 适 应 滤波 的 相关 代码 如 





function II = аар median(I, Smax) 

% ” 目 适 应 中 值 滤 波 函 数 

% example: 

% Е = adpmedian(g, Smax) 对 图 像 g 执 行 自 适应 中 值 滤 波 

% ”从 3x3 模 板 开 始 ， 一 直 运 代 至 SmaxxSmax, Smax 是 比 1 大 的 奇数 


if (Smax <= 1) || (Smax/2 == round(Smax/2)) || (Smax ~= 
round(Smax)) 


error('SMAX must be an odd integer > 1.') 
end 


% 初始 化 . 

ІІ = І; 

ІІ(:) = өе; 

а1геадуРгосеѕѕеа = false(size(I)); 


% 5/14. 

for К = 3:2: 5тах 
zmin = ordfilt2(I, 1, опеѕ(К, К), 'ѕумтеёгіс'); 
zmax ordfilt2(I, k * k, ones(k, k), 'symmetric'); 
zmed = medfilt2(I, [k k], 'symmetric'); 


processUsingLevelB = (zmed > zmin) & (zmax > zmed) & 


~а1 геаауРгосеѕѕеа; 
zB = (І > zmin) & (zmax > І); 
outputZxy = processUsingLevelB & zB; 
outputZmed = processUsingLevelB & ~zB; 
II(outputZxy) = I(outputZxy); 
II(outputZmed) = zmed(outputZmed); 


alreadyProcessed = alreadyProcessed | processUsingLe 
velB; 
if all(alreadyProcessed(:)) 
break; 
end 
end 


II(-alreadyProcessed) = zmed(~alreadyProcessed); 


Hy ЧИЗ АШ Н lenk, IAE 750.05 


的 高 斯 噪声 。 用 中 值 滤 疲 和 目 适 应 中 值 滤波 进行 复 
原 。 相关 代码 如 下 。 


I=imread('lena.bmp'); 

І0=ітпоіѕе(1І, 'ѕа11 & pepper',0.01); 
I1=medfilt2(I0,[3,3]); 

І2=аар теаіап(10,7); 

subplot(221); 

imshow(I); 

title(' 原 图 ') 

subplot (222); 

imshow(I0); 


title( ' ЖА ЕПН р ' ) 
subplot(223); 
imshow( I1); 
title(' 中 值 滤 波 ') 
subplot(224); 
imshow(12); 


title(' HEMPEL ) 





结果 如 图 8.14 所 示 。 

仔细 观察 图 8.14 中 图 像 的 细节 ， 目 适应 中 值 渡 
波 所 得 的 图 像 在 毛发 等 细节 位 置 保 持 了 更 多 的 细 
节 ， 而 在 中 值 滤波 方 法 中 则 变 得 模糊 了 о 

日 适 应 中 值 小 波 的 好 处 可 以 轧 结 如 下 几 点 。 


(1) 云 除 椒盐 噪声 。 


(2) 平 请 其 他 非 脉 冲 噪 声 。 
(3) Ж > ДЖ» 


Figure 1 
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概 盐 噪 声 
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8.3.3 Visual C++ 实现 


编写 目 适 应 中 值 滤 波 的 核心 函数 
AdpMedianFilter0， 相 关 代 码 如 下 。 


/ KK K * * K * K K K K K K K * K K K K K K K K K K K XK * K K K 


void CImgProcess::AdpMedianFilter(unsigned char *lpImag 
e, long lWidth, long lHeight, int nSmax) 
功能 : ХВИИ А ЛУ ЕН {Н 363 


参数 : 

unsigned char *1pImage: TA BJ ЖСН 1@ £T 
long lWidth: ЮА: u, J 

long lHeight: ИЛ 

int пЅтах: 最 大 窗口 大 小 ， 必 须 为 奇数 
返回 值 : 

Л 


a u Su ЕТЕТШ К 


void CImgProcess::AdpMedianFilter(unsigned char *1рТтар 
e, long lWidth, long lHeight, int nSmax) 
l 

// nSmax VANTA 

1f(2*(nSmax/2) == nSmax) 


AfXxMessageBox(" 第 4 个 参数 必须 为 奇数 ! "); 
return; 


) 


unsigned char *1р5гс = Ө, *1pDst = 0; 

//long lSaveWidth = (((8*lWidth) + 31) / 32 * 4); 

long lSaveWidth = lWidth; 

unsigned char *lpNewImage = new unsigned char[lSaveNWi 
dth * lHeight |; 

memcpy(lpNewImage, lpImage, lSaveWidth*lHeight); 


LPBYTE pArray = new ВҮТЕ[п5тах*п5тах | ; 

int nFileterMX, nFileterMY; 

unsigned char iMin, iMax, iMed, iCurPixel; 

int A1,A2,B1,B2; 

BOOL *pbProcessed = пем BOOL[lIWidth * lHeight |; 
memset(pbProcessed, FALSE, lWidth*lHeight * sizeof(BO 


OL)); 


int nWindowOrder; // 窗口 大 小 
for(nWindowOrder= 3; nWindowOrder <= nSmax; nWindowOr 
der += 2) 
l 
nFileterMX = nWindowOrder/2; 
nFileterMY = nWindowOrder/2; 
for(long i = nFileterMY; i < lHeight-nWindowOrder+n 


FileterMY+1; i++) 


for(long j = nFileterMX; j < lWidth-nWindowOrder+n 
FileterMX+1;j++) 


l 
lpDst = lpNewImage + lSaveWidth*(lHeight-1-i)+j; 


for(int k = ð; k < nWindowOrder; k++) 
l 


for(int m = 0; m < nWindowOrder; m++) 
l 
lpSrc = lpImage + lSaveWidth*(lHeight-1-i+nF 
ileterMY-k)+j-nFileterMX+m; 
pArray[k*nWindowOrder+m] = *lpSrc; 


) 
} 


GetMaxMinNum(pArray, nWindowOrder*nWindowOrder, 
iMax, iMin, iMed); 

lpSrc = lpImage + lSaveWidth*(lHeight-1-i)+]j; 

iCurPixel = *lpSrc; 

A1 = iMed-iMin; 

A2 = iMed-iMax; 

if(A1 >= O && A2 <= Ө && !pbProcessed[lWidth*(1H 
eight-1-i)+j]) 


{ 
pbProcessed[| 1Width*(lHeight-1-i)+j] = TRUE; 


B1 iCurPixel-iMin; 
B2 = iCurPixel-iMax; 
1Ғ(В1 > © && B2 < Ө) 


l 
*]pDst = iCurPixel; 
J 
else 
l 
*]pDst = iMed; 
J 
J 


} 
} 
} 
memcpy(lpImage,lpNewImage,lSaveWidth*lHeight); 
delete |[ J]pArray; 
delete | ]lpNewImage; 
delete []рБРгосеѕѕеа; 


Я.Н [ЖЕГП Хх ХИА. se 48 
和 中 值 的 函数 GetMaxMinNum(), 相 关 代 人 码 如 下 。 





/ KK K * * K * * K K K K K K * * * K K K K K K K K K XK * K XK XK 


void CImgProcess::GetMaxMinNum(unsigned char * pArray, 
int nFilterLen, 

unsigned char &ucMax, unsigned char &исМіп, unsig 
ned char &ucMed) 
功能 : ТЕЧ A АЕА. МЕНЧЕ 


参数 : 
unsigned char * pArray: 输入 的 图 像 窗 口 数组 指针 
int nFilterLen: 和 窗口 中 保 系 个 数 


unsigned char &ucMax: 得 出 的 最 大 值 


unsigned char &исМіп: 得 出 的 了 最 小 值 
unsigned char &ucMed: 得 出 的 中 值 
返回 仁 : 

万 


TT DT TD Tr tr Dh 
void CImgProcess::GetMaxMinNum(unsigned char * pArray, 
int nFilterLen, 
unsigned char &ucMax, unsigned char &ucMin, unsig 

ned char &ucMed) 
l 

int 1; 

int J. 

unsigned char iTemp, bTemp; 


for (j = 90; j < nFilterLen - 1; j ++) 
l 


for (i = 0; i < nFilterLen - j - 1; i ++) 


if (pArray[i] > pArray[i + 1]) 
{ 
iTemp = рАгғгау[і |; 
рАггау[1] = рАггау[і + 1]; 
рАггау[1 + 1] = iTemp; 
} 
} 


} 
// 计算 中 全 
if ((nFilterLen & 1) > 0) 


{ 
// AH аро, ЈЕ [а 18] TG 
bTemp = pArray[(nFilterLen + 1) / 2]; 


} 


else 


l 
// 数组 有 倡 数 个 元 系 ， 返 回 中 间 两 个 元 系 平 均值 


bTemp = (pArray[nFilterLen / 2] + pArray[nFilterLe 
n / 2 + 1]) / 2; 
J 
ucMax 
ucMin 
ucMed 


pArray[nFilterLen-1]; 
pArray[8]; 
bTemp; 





АІ Н AdpMedianFilter( A ZSE I Н r w rH B Së 
W ЛЇЇ 576 рІРррето LFE P ТЛ 2 рА 27 
void CDIPDemoView:: OnMenuAdaMed0 中 ， 其 中 


调用 AdpMedianFilterO 函 数 的 代 但 户 断 如 下 所 示 。 


CImgProcess ітеІприї = pDoc->m Image; 


// Е окр R 
if (imgInput.m pBMIH->biBitCount!=8) 


AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 


return; 


) 


CImgProcess imgOutput = imgInput; 


imgInput.AdpMedianFilter(&imgOutput); 


pDoc->m_ Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 淋 
B її “ИЯ ЈА 目 适 应 中 信 滤 站 ?来 进行 目 适应 


中 值 滤波 。 


打开 一 幅 测 试图 像 ， 用 “图 像 复 原 椒盐 噪 
声 ” 依 令 添 加 噪声 ， 再 进行 滤波 。 图 8.15 (a) 为 
用 “图 像 增强 中 值 滤波 ”命令 的 处 理 结果 ， 图 
8.15(b)〉 为 用 “图 像 复 原 - 目 适应 中 值 滤波 ”命令 有 的 
处 理 结果 。 





(а) 中 值 滤波 (b) 自 适应 中 值 滤波 
图 8.15 ”滤波 结 
8.4 Жур E JR 


本 节 介 绍 逆 滤 波 复 原 ， 并 给 出 MATLAB 和 
Visual C++ 实现 。 


8.4.1 ЛБ J E 


AURE АТЕЙ, de, B 


声 ， (т,у)=0 „ 1: 
H|afilz, y) + bfalz,u)| = ан (filz, y)| +ЬН|{»\т, у) 
(8-20) 


则 系统 五 是 一 个 线性 系统 。 这 里 ，a 和 b К 
I| A, AG) Meen 是 任意 两 幅 输 入 的 图 像 。 取 da 
=b =1 时 ， 式 (8-20) А7: 


НЛ, у) + falz, y) = НА, y)] + Hlfolz, y)] 
(8-21) 
这 就 是 所 谓 的 加 性 。 这 一 特性 人 简 蛙 地 表明 ， 如 
ЖН 为 线性 算 子 ， 那 么 两 个 输入 之 和 的 啊 应 等 于 两 
个 啊 应 之 和 。 
Щ лжи) =0, Дх\, (8-20) Ж: 
Н [а]\(т,у)|] = аН|}\(т,у)] 


(8-22) 


Й JOJ E, ERE J ЖЕНЕН A 


ШИ] y SF ARA ЦИ Л ЖЕ РДН 1А] Н 8, В 126 
МЕ АУЛИЕ ЈЕ. 


对 于 任意 f(x ,y )、a 168, WRA: 


H|fiz — a y — B)] = glz а, у В) 
(8-23) 


ШТЕТЕ У.А 9 ЛАЯ OS Kale) = He BJ £ 
统 ， 称 为 空间 不 变 系 统 。 这 个 定义 说 明 图 像 中 任 一 
点 的 啊 应 只 取决 于 在 该 点 的 输入 值 ， 而 与 该 点 的 位 
置 无 关 。 因 此， 图 像 复 原 问 题 可 以 在 线性 系统 的 理 
ЛЕ P Ж 


在 没有 噪声 的 情况 下 ， 颍 域 退 化 醒 型 可 由 下 陈 
给 出 : 
Glu, v) = Hiu, v) Flu, u) 
(8-24) 
APRITE INBER, IB RAA R 
wE. TARRA 47 ЛУ: 


Glu, v) 


Fiu v) = 一 一 一 
Н{и. u) 





(8-25) 


ле а, С НОВИ BAARNE E K A 
ЖЭР К 0 лч n] РАК И АН РАИСА eA ОА. Bü 
后 取 傅 里 时 逆 变 换 即 可 得 到 复原 的 图 像 : 


f (т, у) = Е. а F7! | 





Glu, т) 
Н (и, v) 


(8-26) 
х л ЕВ, AUERI. ТЕН ШЕН) 
Ho F, БЕ НУЛА КАЈ ЫЈ: 


Glu, v) N (u, u) 


Fiu v) = 一 一 一 一 一 一 
Huv) Ни, v) 








(8-27) 


但 是 退化 过 程 的 传递 函数 是 不 可 知 的 ， 且 噪声 
项 也 无 法 精确 得 到 。 另 外 ， 在 上 式 中 ， 传 递 函数 三 
(uwv ) 充 当 分 母 ， 在 很 多 情况 下 传递 函数 的 值 为 零 
或 接近 零 ， 此 时 得 到 的 结果 往往 是 极度 不 准确 的 。 
一 种 解决 方法 是 ， 仅 对 半径 在 一 定 范围 内 的 傅 里 叶 
系数 进行 运算 ， 由 于 通常 低频 系数 值 较 大 ， 高 频 系 
故 接近 零 ， 因 此 这 种 方法 能 大 大 减少 过 到 鹤 值 的 


8.4.2 MATLAB 实 现 


Н Н E У K 2yrev_filter() R] KEI — E E1 ру 
HÉ, РАД Ti 4S 644 chapter8/code/” i4 
下 的 “rev filter.m” 文 件 中 。 


调用 格式 如 下 。 


I new = rev filter(I, H, threshold) 


对 图 像 I 进行 池 滤波 ， 并 将 结果 返回 。 
参数 说 明 : 
° ІУ Л ИЕ; 
° H IRH RZ, 
• Threshold 为 迎 涛 波 的 半径 。 
返回 值 : 
° | new 为 滤波 后 的 图 像 ， 大 小 与 T 一 致 。 


利用 MATLAB 实 现 一 定 半径 内 的 地 滤波 的 相关 
代码 如 下 。 





function I new = rev_filter(I, H, threshold) 
% 逆 滤 疲 复 原 函 数 

% I new = rev filter(I, H, threshold) 

% I: 原始 图 像 


SS 


О Н: 传递 图 数 


% thresho1ld: 赣 滤波 的 半径 
% I пем: 复原 图 像 


% 重 为 彩色 网 像 ， 转 为 为 灰 度 图 像 

if ndims(I)>=3 
I=rgb2gray(I); 

end 


Id=im2double(I); 


% 健 里 叶 变 换 

f Id=fft2(Id); 

f Id=fftshift(f Id); 
fH Id=f Id; 


[M,N]=size(fH Id); 
% JEY 
if threshold>M/2 
% 全 滤波 
fH Id=fH Id./(H+eps); 
else 
% 对 一 定 半径 苑 围 内 进行 滤波 
for i=1:M 
for j=1:N 
if sqrt((i-M/2).^2+(j-N/2).^2)<threshold 
fH_Id(i,j)=fH_Id(i,j)./(H(i,j)+eps); 
end 
end 
end 
end 


% 执行 傅立叶 逆 变换 

fH Id1=ifftshift(fH Id); 

I new=ifft2(fH Idl); 

I new=uint8(abs(I new)*255); 


| 
调试 该 琐 数 ， 分 为 以 下 两 个 步骤 。 
(1) 退化 。 使 用 不 同 半 和 从 大 小 做 赣 滤 流 复 
原 。 取 图 像 处 理 常用 的 256x256 的 lena 灰 度 图 像 ， 按 
Fo A ОНТ ЖИ О IPE TE: 
Н (u, v) = ехр(—Ё ж [Ú — M/2)° + (0 — N/D” 5) 


(8-28) 


其 中 , k=0.0025, М. МАИ НА 
Е Н а S [Аа мо, о уо) 为 频谱 的 中 心 位 置 。 

运行 以 下 命令 即 可 完成 退化 操作 ， 并 将 得 到 的 
退化 图 像 你 存在 lena_t.bmp 中 。 





% 读 进 原始 网 像 

І = imread('lena.bmp'); 
figure(1); 

subplot(121) 

imshow(I) 

title(' 原 始 图 像 ' ) ; 
f=im2double(I); 


% 傅立叶 变换 
F = fft2(f); 
F=fftshift(F); 


% 执行 退化 

[M,N]=size(F); 

[u,v]=meshgrid(1:M,1:N); 

H=exp(-0.0025* ( (и-М/2).^2 + (v-N/2).^2 ) .^(5/6) ); 
Е=Е.*Н; 


% 傅立叶 反 变 换 
X=ifftshift(F); 
x=ifft2(X); 

subplot(122) 
x=uint8(abs(x)*256); 
imshow(x) 
imwrite(x,'lena t.bmp'); 


title(' 退 化 图 像 ') 


原 她 图像 和 退化 图 像 如 图 8.16 所 示 。 


Figure 1 


File Edit View Insert Tools Desktop Window Help 


Qamsi %а әр к- а nia sm 





48.16 ”退化 


(2) 复原 。 运 行 以 下 命令 ， 分 别 采 用 国 仁 
128、108、78、48 对 退化 图 像 lena_t.bmp 进 行 逆 涛 





%% 
% WS 
Ið=imread('lena_t.bmp'); 


% 818 77128 
І пем1 = геу +і1+ег(10, Н, 128); 


% 国信 为 168 

I new2 = rev_filter(I0, H, 108); 
% 国信 为 78 

I_new3 = rev_filter(I0, H, 78); 


% {Н 7у48 

І пем4 = rev_filter(I0, H, 48); 
si=zeros(M,N,1,4,'uint8'); 
51(:,:,1)=І пем1; 

51(:,:,2)=І пем2; 

51(:,:,3)=І пем3; 

51(:,:,4)=І пем4; 


% 绘图 

figure 

montage(si) 

title(']RB r2)2J128,108,78,48') 


滤波 结果 如 图 8.17 所 示 。 


Figure 1 


Eile Edit View Insert Tools Desktop Window Help 
ego b samo A-a na am 
ДЕЕ 108 78 48 


9 





48.17 XEY 


在 图 8.17 中 ， 左 上 角 的 图 像 采 用 半径 128〈 图 像 
尺寸 为 256x256) ， 相 当 于 全 滤波 ， 此 时 得 不 到 下 
确 结 果 ; 取 国 值 为 108 时 可 以 观察 到 细小 的 高 频 失 
я; 国信 取 78 时 效果 恨 好 ， 国 值 取 48 时 半径 过 小 ， 


ER (Y Wr 814 ZH T; 
8.4.3 Visual C++ 实现 


ВСА НАИ ЕНУДЕ Ва, ЕН 
FreqInvTuihua( A 521. 


/ KK K * * * * K K K K K K K K K * K * K K K K K K K K K * * K K K K K K K K K XK K XK XK K K K K K K X 


BOOL CImgProcess::FreqInvTuihua(double * pdFilter) 


功能 : 
生成 对 应 于 退化 的 滤 镜 
参数 


double * pdFilter 
指 问 输出 小 镜 的 指针 


返回 值 : 
BOOL 类 型 ，true 为 成 功 ，false 为 失败 
人 


BOOL CImgProcess::FreqInvTuihua(double * pdFilter) 


{ 
if (т pBMIH->biBitCount!=8) return false; 


// 计算 滤 锐 大 小 
LONG w = GetFreqWidth(); 
LONG h GetFreqHeight(); 


IT шк. 

for (int i=0; i<h; i++) 

l 
for (int j=0; j<w; j++) 
l 


// 在 写 入 时 对 滤 镜 进行 必要 人 处理 ， 按 照 MATLAB 函 数 ifftshif 


t 的 原则 平移 

double fl = ( (i-h/2)*(i-h/2)+(j-w/2)*(j-w/2) ); 
//, 5.0/6 ); 

#1 = pow(f1, 5.0/6); 

{1 *= -0.0025; 

fl = exp(fl); 

pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j<W/2 ? j 
+w/2 : j-w/2)] = fl; 


} 
} 


return true; 


} 


利用 FreqInvTuihua() 函 数 实现 图 像 退 化 的 示例 
修 封 猜 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView:: OnInverseFTuihua() 中 ， 其 中 调用 
FreqInvTuihua0 р ZX HJ АЧ Jr Br ill ТУК o 





// WARR 


CImgProcess ітеІприї = pDoc->m Image; 


// Е окр R 
if (imgInput.m pBMIH->biBitCount!=8) 


{ 
AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 
return; 


) 


BeginWaitCursor(); 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 锐 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// 生成 频 域 小 镜 
double * pdFreqFilt = new double[w*žh]; 
imgInput.FreqInvTuihua(pdFreqFilt); 


// ”应 用 小 镜 
imgInput.FreqFilt(&imgOutput, pdFreqFilt); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 


ШЛЁМ Ы ЖАН ИБИ pa, HER 29 
FreqInvFilter( SEM, НЭ Т 





/ KK K * * K * K K K K K K K K K * K * K K K K K K K K K * * K K K K K K K K K XK K XK K K K K K K K X 


BOOL CImgProcess::FreqInvFilter(double * pdFilter, int 


nRad) 

功能 : 

生成 对 应 于 逆 滤 波 的 滤 镜 

参数 : 

double * pdFilter: 指向 输出 滤 镜 的 指针 
int nRad: ШЕ у ДУ 

返回 值 : 


BOOL 类 型 ，true 为 成 功 ，false 为 失败 


人 


BOOL CImgProcess::FreqInvFilter(double * pdFilter, int 
nRad) 


{ 
if (т pBMIH->biBitCount!=8) return false; 


// 计算 滤 锐 大 小 
LONG w = GetFreqWidth(); 
LONG h GetFreqHeight(); 


// 滤 镜 产生 过 程 
for (int i=0; i<h; i++) 
{ 
for (int j=0; j<w; j++) 
{ 
if (sqrt( pow((double)(i-h/2),2) + pow((double)(j- 
м/2),2) ) <= паа) 


// ÆSA ITET PE АРН, }ЖЦЕМАТ! АВА Ж{1+#Е©5һ 
ift 的 原则 平移 
double fl = ( (i-h/2)*(i-h/2)+(j-w/2)*(j-w/2) ) 


f1 = pow(f1, 5.0/6); 

{1 *= -0.0025; 

f1 = exp(f1); 

pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j<w/2 ? 
j+w/2 : J-w/2)] = 1.0/(f1+0.000001); 


} 
} 


return true; 


) 


ЖЇН FreqInvFilterO R 591 А лё yv rH {Н ЕЕН 
IRAE E рІРрето С F MI RÆ A уоіа 
CDIPDemoView:: OnInvRestore() 中 ， 其 中 调用 
FreqInvFilter0) 了 水 数 的 代码 厂 断 如 下 所 示 。 


// 输入 对 象 


CImgProcess ImgInput = pDoc->m Image; 


// 检 奉 图 像 羡 灰 度 图 
if (imgInput.m pBMIH->biBitCount!=8) 


l 
AfxMessageBox(" 4 zE8-bppAkK ERZ, KARHE! "); 


return; 


) 


CDlgInvFilter dlg; 
dlg.m iRad = imgInput.m pBMIH->biWidth; 


if (dlg.DoModal() != IDOK) 


return; 


} 


BeginWaitCursor(); 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 镜 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// ЖЛ ЈЕВ 
double * pdFreqFilt = пем аоиб1е[м*һ |; 


imglnput.FreqInvFilter(pdFreqFilt,dlg.m iRad); 


// МАН) 
imglnput.FreqFilt(&imgOutput, pdFreqFilt); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 





wA Н] РДАН ЭЭ А НУКЕ РЮІРрОето у> 
AmS RAR Ja, 退化 ?执行 退化 ， 如 网 8.18 所 
示 。 肌 选择 “图 像 复原 这 滤波 复原 ”命令 ， 打 开 半 
径 设 置 对 话 框 ， 输 入 逆 涛 疲 的 半径 ， 意 击 “ 人 确定 ? 执 
行 复原 。 半 径 为 128、108、78 和 48 时 的 效果 如 图 
8.19 所 示 。 





图 8.18 ”退化 


. 15 т, 
a aaa 
二 Ил 





; Š s V | і k 
(a) 半径 128 (b) 半径 108 (c) 半径 78 (d) 半径 48 


图 8.19” 首 滤波 


8.5 JEI R JE 


本 节 介 绍 维 纳 滤 流 复原 ， 并 给 出 MATLAB 和 
Visual C++ 实现 。 


8.5.1 维 纳 滤波 原理 


AVEU УУ НЕЙ ТЕ АВЕ АЖ, ADIER 
ШИН] дй» ЯЯ С С аве] 77 REE КЕТ 
А BARAR, АУН РАИ (Ох) 
ЛИВ), EAEI RARD. каН F 
式 给 出 : 





(8-29) 


假定 噪声 与 图 像 征 个 相关 的 ， 复 原 图 像 的 最 佳 
fara UH F oak: 


H! (uv) 


Ffu, v) = Ea жЕ Е ha) (т\ш. и) 
Н (и, v| + Snu, о) ри, 


(8-30) 
рни)? = НТ(и,ь)н(и,») ， 因 而 又 可 以 写 为 : 
(8-31) 


陈 中 各 项 的 定义 分 别 如 下 。 
н(и. о): 退化 函数 。 
ra: 共 扳 退化 函数 。 
Н(и, 0)? = НТЇ(и,ъ)Нн(и,ъ) o 
so ШЕРТУ. 
Sr): КИРИЈА, 
х КГ, RURAR, Д], (а.е) =0 


， 此 时 维 纳 滤 波 退 化 为 逆 滤 波 。 该 式 还 存在 一 个 问 
ЕЙ, В| sa.) Esr) 如 何人 和 估计。 假设 退化 过 程 已 
知 ， 则 но. о) 可 以 确定 ; МБЕ а уат ДТ НЕЕ, 
则 5,00) IER (Esr) i EPI ТГ» ЛИЦ 
НУ in ЕН T ААК IN Sa(u.e)/Sr(u.o) ， 
KAREN: 


Р Ы. 
1 Hiu, v) 


шу | =. 
Hyu, v) |H(u,u)|” + K 


Glu, v) 


(8-32) 


р, TENER, EMERIK 
m. 


8.5.2 MATLAB 实 现 

使 用 目 定 义 函 数 wn_filter0 可 实现 维 纳 滤波 ， 
国 数 位 于 配 父 光盘 “chapter8/code/” 路 径 下 
的 “wn _ filter.m” 文 件 中 。 


调用 格式 如 下 。 


I new = wn filter(I, H, threshold, K) 


对 图 像 I 进 行 维 纳 滤波 ， 开 将 结 来 返回 。 


参数 说 明 : 


е ІЛ ИВЕ: 

° H 为 传递 函数 ; 

• Threshold 为 滤波 的 半径 ， 距 离 中 心 点 超过 
threshold 的 傅 里 叶 系 数 将 你 持原 值 ; 

° K 为 噪声 -网 像 功 率 比 。 


返回 值 : 
° | new 为 滤波 后 的 网 像 ， 大 小 与 了 一 致 。 
利用 MATLAB 实 现 维 纳 滤波 的 相关 代码 如 下 。 


function I new = wn_filter(I, H, threshold, K) 
维 纳 滤波 复原 函数 

I new = rev filter(I, H, threshold) 

І: 原始 图 像 

K: 噪声 -图 像 功 率 比 

thresho1d: 逆 滤波 的 半径 

І пем: 复原 图 像 


% 若 为 彩色 图 像 ， 转 为 灰 度 图 像 

if ndims(I)>=3 
I=rgb2gray(I); 

end 


SS 


SS N XN XN XN X 


Id=im2double(I); 


% i 177 


f Id=fft2(Id ) ; 

f Id=fftshift(f Id); 
fH Id=f Id; 
D=abs(H); 

р=р.^2; 


[M,N]=size(fH Id); 
% WET 
if threshold>M/2 
% 全 滤波 
fH Id=fH Id./(H+eps); 
else 
% 对 一 定 半径 艺 围 内 进行 滤波 
for i=1:M 
for j=1:N 
if sqrt((i-M/2).^2+(j-N/2).^2)<threshold 
% HINE У 
fH_Id(i,j)=fH_Id(i,j)./(H(i,j)) .* (D(i, 
J)./(D(i,j)+K)); 
end 
end 
end 
end 


% 执行 傅立叶 逆 变 换 

fH Id1i=ifftshift(fH Id); 

I new=ifft2(fH Id1); 

I new=uint8(abs(I new)*255); 


对 256x256 的 lena 灰 度 图 像 进 行 退 化 处 理 ， 有 再 还 
加 高 斯 噪声 ， 对 得 到 的 退化 图 像 进行 复原 。 步 又 如 
下 。 


(1) Himnoise0 ЛИН 7728, JEN 
0.001 的 高 斯 噪声 。 


(2) 将 逆 小 波 和 维 纳 滤波 复原 效果 进行 对 
比 。 其 中 道 滤波 采用 8.4.2 小 节 中 给 出 的 rev_filter() 
函数 。 维 纳 小 波及 用 wn_filter0 函 数 。 


相关 代码 如 下 。 


% HAIEI- EEX 
clear; 
clc; 


%% 
I=imread('lena.bmp'); 


% 傅 里 叶 变 换 
[m,n]=size(I); 
FI=fft2(I); 
FI=fftshift(FI); 


% 退化 

k=0.0025; 

u=1:m; 

v=1:n; 

[u,v]=meshgrid(u,v); 
Н=ехр((-К).*(((и-т/2).^2+(у-п/2).^2).^(5/6))); 
С=ҒІ.*Н; 


% 添加 噪声 
IƏ9=real(ifft2(fftshift(G))); 
I1=imnoise(uint8(I0),'gaussian',0,0.001); 


figure(1) 
imshow(11); 
imwrite(I1, 'lena wn.bmp') 


0% 
І1=ітгеаа( '1Іепа wn.bmp'); 


%% 逆 渡 波 

І пем = геу filter(I1, H, 48); 
figure(2); 

imshow(I new) 


title(' 逆 滤波 结果 ' ); 
%% 维 纳 滤波 


K=0.05; 
І пем1 = wn_filter(I1, H, 48, К); 
figure(3); 


imshow(I пем1); 


title(' 维 纳 滤 波 结 果 '); 


退化 儿 像 相 比 原始 图 像 清晰 上 度 有 所 下 降 ， 
加 了 噪声 ， 如 图 8.20 所 示 。 


НҢ. 
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8.20 ”退化 图 像 


迎 滤 站 和 维 纳 涛 流 取 滤波 半径 为 48， 维 纳 波源 
取 噪 声 -图 像 功率 比 0.001。 滤 波 后 的 图 像 分 别 如 网 
8.21 和 图 8.22 上 所 示 。 


Figure 2 
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Figure j 
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48.22 维 纳 滤 波 结果 


从 以 上 两 图 中 可 以 看 到 ， 取 同样 的 半径 时 ， 维 
VEW PH fa BHR EERE VEUX YH BRIR FA HIAR SE TEI o 


MATLAB 为 维 纳 滤波 提供 了 专用 的 函数 
deconvwnr()， 调 用 格式 如 下 。 


J = deconvwnr(I,PSF,NSR) 


IEAI HEITE, ЭЕ ЖА [А]. 


参数 说 明 : 
° 为 输入 的 图 像 矩 阵 ; 
° PSF 为 点 扩散 图 数 ， 即 退化 函数 的 频 拭 表示 
• NSR 为 噪声 -图 像 功 率 比 ， 默 认 便 为 堆 。 
返回 值 : 
° 了 为 滤波 后 的 图 像 ， 大 小 与 一致。 


万 一 种 调用 形式 如 下 。 


J = deconvwnr(I,PSF,NCORR,ICORR) 


NCORR 和 ICORR 分 别 为 噪声 和 图 像 的 目 相 关 
РА o 
会 


。J 为 输入 的 图 像 窍 阵 ; 

° PSF 为 点 扩散 闵 数 ， 即 退化 函数 的 频 域 表 示 ; 
。NCORR KIE У НАН 25; 

° ICORR 为 图 像 的 目 相 天 函数 。 


返回 值 : 


° J 2780 Ji АЈ, ХХЫ 37. 
使 用 deconvwnrO 进 行 滤波 的 相关 代码 如 下 。 


%% 
clear,clc 


% 读 入 退化 图 像 


I1=imread('lena wn.bmp'); 


[m,n]=size(I1); 
k=0.0025; 

u=1:m; 

v=1:n; 
[u,v]=meshgrid(u,v); 


% 退化 函数 
H=exp((-k).*(((u-m/2).^2+(v-n/2).^2).^(5/6))); 


% 退化 图 像 对 应 的 点 扩 敌 函 数 
PSF=ifftshift(ifft2(H)); 


% 维 纳 滤波 

I2 = deconvwnr(Il,abs(PSF),0.08); 
imshow(I2 ) ; 

title( ' 1 десопумпг у ') 





滤波 结果 如 图 8.23 所 示 。 
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Eile Edit View Insert Tools Desktop Window Help | 
edo s sa a Z a ns sm 
19 ЕН Чесппумт yE 





48.23 1} аесопумтгу& y% 


调节 噪声 -图 像 功率 比 至 恰当 值 ， 滤 波 结果 与 
图 8.22 相 仿 。 


8.5.3 Visual C++ 实现 
维 纳 滤 波 的 滤 镜 生成 函数 代码 如 下 。 





了 下 


BOOL CImgProcess::FreqWienerFilter(double * pdFilter, i 
nt nRad, double K) 


生成 对 应 于 维 纳 滤 波 的 滤 镜 


参数 : 

double * pdFilter: ”指向 输出 滤 镜 的 指针 

int nRad: li ey НЕ 

jx [н|{: 

BOOL 类 型 ，true 为 成 功 ，false 为 失败 
人 
BOOL CImgProcess::FreqWienerFilter(double * pdFilter, d 
ouble K) 


{ 
if (т pBMIH->biBitCount!=8) return false; 


// 计算 滤 锐 大 小 
LONG w = GetFreqWidth(); 
LONG h GetFreqHeight(); 


// 滤 锐 产生 过 程 

for (int i=0; i<h; і++) 

l 
for (int j=0; j<w; j++) 
l 


// G APPS Sa SET ЖЕЙБИ, ТЖЦЕМАТ! АВА Ж{1+#Е©5һ 
ift 的 原则 平移 
double fl = ( (i-h/2)*(i-h/2)+(j-w/2)*(j-w/2) ) 


#1 = pow(f1, 5.0/6); 
fl *= -0.0025; 
f1 = exp(f1); 
pdFilter[(i<h/2 ? i+h/2 : i-h/2 ) * w + (j<w/2 ? 
j+w/2 : j-w/2)] = 1.0*f1*f1/ 
((f1*f1+K)*(fl+0.000001)); 


return true; 
J 


ХІ] Н FreqWienerFilter() РЁ 455 1 EHRE PIZ 
J| ЖЗ Эм EDIPDemo T FEF АЈА 2 pR 27void 
CDIPDemoView:: OnWienerFilter() 中 ， 其 中 调用 


FreqWienerFilter( РЁ ИКУ r Br ll F PZ 


// 输入 对 象 


CImgProcess ітеІприї = pDoc->m Image; 


// Е оек R 
if (imgInput.m pBMIH->biBitCount!=8) 


AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 


return; 


} 


BeginWaitCursor(); 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 镜 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// ERIRE 
double * pdFreqFilt = new double[w*žh]; 
imgInput.FreqWienerFilter(pdFreqFilt, 0.05); 


// MHE 
imgInput.FreqFilt(&imgOutput, pdFreqFilt); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 





维 纳 滤波 可 以 处 理 加 噪 退化 的 网 像 ， 在 Visual 
C++ 中 调用 FreqInvTuihua0 和 AddGaussian0 函 数 实 
现 加 噪 退 化 ， 封 装 在 DIPDemo 工 程 中 的 视图 类 函数 
void CDIPDemoView:: OnNoiseTuihua() 中 ， 代 码 片 
Бі К. 


// 输入 对 象 


CImgProcess ImgInput = pDoc->m Image; 


// 检 奉 图 像 羡 灰 度 图 
if (imgInput.m pBMIH->biBitCount!=8) 


AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 
return; 


) 


BeginWaitCursor(); 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 计算 需要 生成 滤 镜 的 大 小 
LONG w = imgInput.GetFreqWidth(); 
LONG h = imgInput.GetFreqHeight(); 


// ЖЛ e Sa 
double * pdFreqFilt = new double[w*h]; 
imgInput.FreqInvTuihua(pdFreqFilt); 


// MW HS Sá 
imglnput.FreqFilt(&imgOutput, pdFreqFilt); 
imgOutput.AddGaussian(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


// 删除 临时 变量 
delete pdFreqFilt; 


读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “图 像 复 原 ,加 噪 退化 ”执行 退化 ， 如 图 8.24 
所 示 。 再 选择 “图 像 复 原 , 维 纳 复原 ”命令 执行 复 
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(а) 维 纳 滤波 (b) 道 滤波 〈 半 径 78) (c) 道 滤波 (半径 48) 


48.25 ”滤波 结果 


86 ”有 有 约束 最 小 二 乘 复 原 


维 纳 小 流 古 基于 统计 的 复原 方法 ， 当 图 像 和 了 唆 
声 部 属于 随机 场 ， 且 频谱 密度 已 知 时 ， 所 得 结果 是 
平均 意义 上 最 优 的 。 有 约束 最 小 二 来 复原 除了 噪声 
的 均值 和 方 和 天 外 ， 不 第 要 所 供 其 他 参数 ， 且 往往 能 
得到 比 维 纳 滤 小 更 好 的 效 琳 。 


有 约束 最 小 二 来 复原 及 用 图 像 的 三 阶 寻 数 〈 可 
用 拉 普 拉 斯 变换 得 到 ) 作为 最 小 准则 函数 ， 定 义 如 
下 : 


(8-33) 
设 g 为 退化 图 像 ，n NRE, A: 
g— Hf=n 
(8-34) 
在 复原 过 程 中 上 式 必 须 满 足 ， 因 此 将 其 作为 约 


束 条 件 。 在 这 里 采用 了 它 的 一 种 变形 ， 即 要 求 上 式 
РАЛЫ САН =: А29 ие, BH: 


lg- НА = | 
(8-35) 
H Plil RIR А АЈ Е rH АЧ 
ШЕН] RRAN TAMRE: 


Pi pa L (u, 27) GI | 
шл) = —— n (u, u 
ІН (u,v) + |Р (u,v) 


(8-36) 


其 中 ， СЕ 寺 调 整 的 参数 ，g 应 使 |y -HFP = l 
成 立 ， P (uv) 是 函数 ptu.w) НИЕ ПРАЗ, рь) 为 拉 
EMET : 


(8-37) 


假如 g =0， 则 复原 的 图 像 表 示 为 


К. | Н* (u.v) | | С (и. U) 
Poe S Cpu, 2530 
H (u,v) H (u,v) 








(8-38) 
此 时 有 约束 最 小 二 乘 复原 退化 为 道 滤波 复原 。 


MATLAB 提 供 了 deconvreg0 函 数 实现 有 约束 最 
小 二 溢 复 原 ，deconvreg0O0 的 调用 格式 如 下 。 


J=deconvreg(I,PSF,N,Range) 


用 于 复原 由 点 扩散 函数 PSF 及 可 能 的 加 性 噪声 
引起 的 退化 图 像 上 ， 算 法 保持 估计 图 像 与 实际 图 像 
之 间 的 最 小 平方 误差 最 小 。 
参数 说 明 : 


° J 为 输入 图 像 窍 阵 ; 
。PSF 7114) ХРА: 


` N 为 加 性 噪声 功率 ， 默 认 值 为 零 。 


Range 为 长 度 为 2 的 同 量 ， 算 法 在 Range 指 定 的 
区 间 中 寻找 了 最 佳 的 拉 格 明日 来 效 ， 默 认 全 为 0e-91e9 
тети жининин 
M HUB o 


j |H (8 : 
° J ЙМ Ji J, ХАМУГ 85. 


[18.2] 使 用 MATLAB 提 供 的 函数 
deconvreg() 实 现 有 约束 最 小 二 乘 复 原 。 


相关 代码 如 下 。 


% ARED RR JE 
%% 

clear,clc 

close all 


%% 产生 退化 图 像 
I=checkerboard(8); 


% 运动 模糊 的 点 扩散 函数 
PSF = fspecial('motion', 7, 45); 


fprintf( НЕ: \п'); 
disp(PSF) 


% XT ENRETE DREY 
Im1 = imfilter(I, PSF, 'circular'); 


% 添加 高 斯 噪声 
noise = imnoise(zeros(size(I)), 'gaussian', 0, 0.001); 
Im = Im1 + noise; 


%% 维 纳 滤波 
Iw = deconvwnr(Im,PSF,0.02); 


%% 约束 最 小 二 乘 滤波 
I=edgetaper(I,PSF); 
Iz = deconvreg(Im, PSF, Ө.2, [1е-7, 1e7]); 


%% 绘图 
subplot(221); 
imshow(I,[]) 
title(' 原 始 图 像 ' ) ; 


subplot(222); 
imshow(Im, []) 
title(' 退 化 图 像 ' ) ; 


subplot(223) 
imshow(Iw,[]) 
title(' 维 纳 滤 波 ') 


subplot(224) 


imshow(Iz,[]) 
title( HARREN 38082 ' ) 


TEML ëd ГЇН ж RRA AR HI АА H RKI 5. 


19 НОРА: 
Ө Ө Ө 
0145 Ө 


0 0 0 0.0376 
1283 0.0145 


Ө 0.0376 0.1283 


Ө 0.0376 0.1283 0.0376 


0 

0.0376 0.1283 0.0376 
Ө 

0.1283 0.0376 Ө 
0 

0.0145 0 

0 





复原 效果 如 图 8.26 所 示 。 
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图 8.26 ”滤波 效果 
可 以 看 出 ， 有 约束 的 最 小 二 乘 滤 波 一 定 程度 上 
能 改 二 原 模糊 噪声 图 像 的 质量 。Edgetaper0 函 数 用 
于 消减 振 铃 现象 。 
8.7 Lucky-Richardson# Jš: 


约束 最 小 二 乘 算 法 只 需要 提供 点 扩散 函数 及 吕 


声 的 参数 ， 但 很 多 场合 下 噪声 的 参数 征 未 知 的 。 
Lucky-Richardson (L-R) 算法 是 非 线性 方法 中 一 种 
典型 的 算法 ， 在 噪声 信息 未 知 时 仍 可 得 到 较 好 的 复 
BAR. L-R IAH AEA KATAR AR E E, 
ЛАКАТА Н] НЕШ) ЧИ. 4 FANER 
сЕ В е КИЦ РА Жн] Е 1] 54 Дїй 


giz, у) 


felt +y) = fiir + yhe, y) x —— 5 —— 
hir y) x frlr,y) 


(8-39) 


如 同 大 多 数 非 线 性 方法 一 样 ，L-R 算 法 很 难保 
证 确切 的 收敛 时 间 ， 只 能 其 体 问题 具体 分 析 ， 对 于 
给 定 的 应 用 场景 ， 在 获得 满意 的 结果 时 ， 观 察 输出 
并 终止 算法 。Lucky-Richardson 所 得 的 解 是 复原 图 
像 的 极 大 似 然 值 ，。 


MATLAB 提 供 了 deconvlucy0 函 数 ， 该 函数 通 


过 加 速 收 伍 的 迭代 算法 完成 图 像 复 原 。 调 用 格 陈 如 
F. 


J=deconvlucy(I,PSF,NumIt,Dampar,Weight) 


对 图 像 I 进 行 L-R 复 原 ， 并 将 结果 返回 。 


参数 说 明 : 


е T У Л BRIE Е; 

。 PSF 为 PSE 为 退化 过 程 的 点 扩散 函数 ， 用 于 恢 
复 PSF 和 可 能 的 加 性 噪声 引起 的 退化 ; 

• Numlt 为 指定 了 算法 迭代 的 底数 ， 默 认 值 为 10; 

° Dampar HAER BZ Im WREE. Smh Fi 
ЕГ, Ар ЕА, БАЛАН 25; 

° Weight 为 每 个 像素 的 加 权 值 ， 记 录 了 每 个 像素 
反应 相机 记录 的 质量 。 


j |H (ñ : 
° J ЙМ ЛА J, ХАМУГ 85. 


[8.3] 使 用 L-R 算 法 复原 被 高 斯 噪声 污染 的 
柄 盘 格 图 像 。 


相关 代码 如 下 。 





% гип lucy 


% L-R 算 法 图 像 复原 


%% 
clear,clc 
close all 


%% 
% ҖИЛЛЕ И 


I=checkerboard(8); 


%КАЛГ HX PRI ZN 
PSF=fspecial('gaussian',7,10); 


% 2722270.0001 
SD=0.01; 
In=imnoise(imfilter(I,PSF),'gaussian',0,SD^2); 


%% 

% 使 用 Lucy-Richardson 算 法 对 图 像 复原 
Dampar=10*SD; 
LIM=ceil(size(PSF,1)/2); 
Weight=zeros(size(In)); 


% 权 值 weight 数 组 的 大 小 是 64*64 
% РАЯ Уеа ЈО Ў, HRABRE 
Weight(LIM+1:end-LIM,LIM+1:end-LIM)=1; 


% ARRÉS 

NumIt=5; 

% 利用 deconvlucy 来 实现 复原 
J1l=deconvlucy(In,PSF,NumIt,Dampar ,Weight); 


% 友 代 次 数 为 16 
NumIt=10; 
J2=deconvlucy(In,PSF,NumIt,Dampar,Weight); 


% 友 代 次 数 为 26 
NumIt=20; 
J3=deconvlucy(In,PSF,NumIt,Dampar,Weight); 


% ЛКИ 24100 
NumIt=100; 
J4=deconvlucy(In,PSF,NumIt,Dampar,Weight); 


%% 绘图 
subplot(231); 
imshow(I); 


title(' 原 图 ') 


subplot(232); 
imshow(In); 


title(' 退 化 图 像 ') 


subplot(233); 
imshow(J1); 
1ї1е('®1Х5#Х') 


subplot (234) 
1тѕћом(72); 
title( '25/010/х') 


ѕиБр101 (235); 
ітѕћом(73); 
title( '25/02015') 
ѕиБр101 (236); 


ітѕћом( 74); 
title('i R100% ') 


运行 结果 如 图 8.27 所 示 。 
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48.27 Т-ВА 
迭代 5 次 时 比 退 化 函数 已 有 不 少 改 进 ， 此 后 随 
AAR ARA ОЛА кает, (Hj au БЕЙ 
Ш. АТМ ФЛДЛ ХА, АКА 
化 。 


88 АХЕЯ JH 


Lucky-Richardson 算 法 不 需要 关于 噪声 的 先 验 
知识 ， 但 点 扩散 图 数 必须 是 已 知 的 。 如 果 不 知 道 点 
J 艇 函数 ， 还 可 以 符 试 使 用 下 去 疮 积 。MATLAB 中 
НЈаесопуЫіпа() 4 3221 / Е 2219278, 1 
式 如 下 。 


[J,PSF]= deconvblind(I,InitPSF,NumIt,Dampar,Weight) 


ЧИМЕ н, ОА 
El. 


参数 说 明 : 


° І) А ИЕ Е; 

° ГпііРЅЕ 为 初始 点 扩散 函数 ; 

• Numlt АААХ, SAVA B 710; 

° Dampar 128918, Smh T 1248 
ШЫ, ЖЕРЛЕ, AMENE; 

° Weight АВЛУ АЛАЛА, WK / EMIR 
反应 相机 记录 的 质量 。 


返回 值 : 


° 为 滤波 后 的 图 像 ， 大 小 与 了 一致: 
° PSF 为 最 终 估 计 的 点 扩散 函数 。 


【 例 8.4】 使 用 讶 去 卷 积 法 复原 被 高 斯 噪声 污 
染 的 棋盘 格 图 像 。 


相关 代码 如 下 。 


% гип blind 
% BAERE J 
%% 

clear,clc 
close all 


%% 产生 棋盘 格 图 像 并 进行 退化 
I = checkerboard(8); 
PSF = fspecial('gaussian',7,10); 


V = .0001; 
% 退化 


BlurredNoisy = imnoise(imfilter(I,PSF),'gaussian',0,V); 


%% 复原 

% 权 值 

Weight = zeros(size(I)); 
Weight(5:end-4,5:end-4) = 1; 


% 所 扩展 函数 的 估计 值 

InitPSF = ones(size(PSF)); 

[J P] = deconvblind(BlurredNoisy,InitPSF,20,10*sqrt(V), 
Weight); 

subplot(221); 

imshow(BlurredNoisy); 

title(' 退 化 图 像 ' ); 

subplot( 222); 

imshow(PSF,[]); 

title(' 点 扩展 函数 '); 


subplot(223); 

imshow(J); 

title(' ЕА 9 Ж"); 
subplot(224); 

imshow(P,[]); 
title(' 和 输出 的 估计 点 扩展 函数 ' ) ; 





初始 点 扩展 函数 采用 全 1 的 7x7 和 矩阵 时 ， 执 行 结 
果 如 图 8.28 所 示 ; 采用 0 一 1 均匀 分 布 随机 数 时 ， 复 
原 结果 如 图 8.29 所 示 。 
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图 8.28 ”初始 PSF 为 全 1 矩阵 
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48.29 ”初始 PSF 为 随机 和 矩阵 


89 MATLAB 图 像 复 原 综合 案例 
去 除 照 上 的 运动 模糊 


如 今 数 但 相机 越 来 越 彰 及 ， 基 全 于 机 上 也 配 症 
T ANP НУС К, ЛААГ ВЕЛ ТАКА 





生活 的 片段 定格 为 图 像 。 然 而 担 摄 过 程 中 往往 由 于 
摄像 机 焦距 个 恰当 、 景 物 移动 速度 过 快 、 摄 像 机 扣 
БАШ АЕ). ERARA ЧЕ ААА], Ли ИН БАНУ 
厂 出 现 “ 退 化 ”， 无 法 反映 真实 场景 。 


运动 代 糊 是 最 第 见 的 退化 现象 之 一 。 图 8.30 束 
足 一 张 水 平方 同上 出 现 运 动 模糊 的 照片 。 由 于 目 行 
车 运动 速度 过 快 ， 在 相机 皮 光 时 间 内 目 行 车 已 经 运 
动 了 一 小 段 距 离 ， 以 全 于 拍摄 后 出 现 了 模糊 。 


这 张 照 厂 的 清晰 图 如 图 8.31 所 示 。 





48.30 ”水 平方 同 运 动 模糊 图 厂 





图 8.31 ”清晰 图 


现 使 用 MATLAB 对 如 图 8.30 所 示 的 图 像 做 去 运 
动人 蛋 糊 ， 狐 建 脚本 de_motion.m， 输 入 代码 如 下 。 





% de motion.m 
clear, clc 
close all 


%% 读 入 图 三 

I=imread('bicycle.bmp'); 

if ndims(I)>=3 
I=rgb2gray (I); 

end 

figure(1); 

imshow(I,[]) 


title(' 运 动 模糊 图 像 ' ); 
%% 去 除 运 动 模糊 


% 水 平方 向 上 运动 2 像素 
PSF=fspecial('motion', 20,0); 


figure(2); 

% WITREN 26 

noise var = 0.0001; 

estimated nsr = noise var / var(double(I(:))); 


% 维 纳 滤波 

I2 = аесопумпг(І,РЅЕ,0.00005); 
imshow(12,[]); 

title( ÆR JR"); 


SRRA HJ ЧОЕ ZJbicycle.bmp. Mitt B 
像 在 水 平方 同上 存在 20 像 系 的 重 登 ， 从 而 引起 模 
糊 。 运 行 脚本 ， 得 到 的 复原 图 像 如 图 8.32 所 示 。 


-) Figure 2 =l 
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48.32 “运动 模糊 复原 


由 图 8.32 可 以 看 出 ， 去 除 运 动 模糊 的 效 霖 非常 
好 ， 复 原 的 图 像 可 以 请 晰 地 办 认 出 车 喘 上 的 字母 


第 9 章 KERAHE 


蝴 看 基于 互联 网 的 图 像 处 理应 用 的 不断 增长 ， 
彩色 图 像 处 理 已 经 成 为 一 个 重要 的 研究 钢 域 。 本 草 
以 介绍 彩色 柑 型 为 主 ， 并 将 涉及 到 数字 域 彩色 处 理 
方面 的 基本 概念 与 弟 识 。 


91 彩色 基础 


大 和 干 世 界 ， 光 彩 绚 丽 ， 色 彩 让 世界 变 得 更 加 述 
A. WA, BÆTA? 色彩 又 有 什么 特性 呢 ? 
在 17 世 纪 60 年 代 ， 人 们 还 普遍 认为 白光 是 一 种 纯 的 
没有 其 他 闫 色 的 光 ， 而 彩色 光 是 一 种 不 知 何故 发 生 
变化 的 光 。 为 验证 设 假 设 ， 牛 顿 让 一 束 太 阳 弃 透 过 
一 面 三 梭 锐 ， 光 在 载 上 被 分 解 为 七 种 不 同 的 闫 色 ， 
ВП. 21. 6. ж, ж, D. B S, т ЖУУ Э 
谱 ， 如 图 9.1 所 示 。 





图 9.1 “Fili Ac ТП БЕ НУ И Ж 


EERTE, PZ, и, ЭК, 1. їй, AA 
ШЕН ТАЈНЕ И, JIER Y ЖАШ ЕРИ 8 — J HI 
Et. BAA PIK HA RAA 6 БТА HJ E 
И, ONENA SEW, BENE НУ 
质 得 到 了 许多 实验 和 理论 结束 的 文 持 。 


1. 什么 是 彩色 


е ИН в Е, MAAE, МХ. E 
量 一 样 。 退 第 ， 它 依赖 于 以 下 3 个 方面 的 因 系 。 


(1) 光源 一 一 照射 沧 的 谱 性 质 或 谐 能 量 分 





(2) 物体 一 一 被 照 射 物体 的 反射 性 质 。 


(3) pk Bal СИНЕ БКИ Sas) 一 一 
光谱 能 量 吸收 性 质 。 


其 中 ， 区 特性 是 闫 色 科 学 的 核心 。 假 如 光 十 没 
AWEK ОНЕ, 8 ЈА A BA 
26), ВАЕ е ЕКЙ ЭН. PAH 
к НУО ВЛА Ж 2) 06, ыл?! 


MATKE ЖШ? ЗАДН НО 
源 的 质量 : 074. ЭБОЛ. 


(1) 辐射 率 是 从 光源 流出 能 量 的 总 量 ， 通 帝 
用 瓦特 (М) 度量 。 


(2) 光 强 用 流明 大 量 ， 它 给 出 了 观察 者 从 疮 
源 搂 收 的 能 量 总 和 的 度量 。 


(3) 腕 度 古 彩色 强度 概念 的 具体 化 。 它 实际 
上 十 一 个 难以 度量 的 主观 拍 绘 


同样 作为 能 量 的 度 星 ， 辐 射 计 与 光 强 却 往 往 没 
有 人 尾 然 的 耿 系 。 例 如 ， 在 进行 X 光 检查 时 ， 光 从 
Яа, CERA А ЕНЕН). (Н 
HJ АЖА А Э ВЕД УК, ТЕА AAR ER bu; 
到 。 因 而 对 人 们 来 襄 ， 它 的 光 强 几乎 为 0。 


2， 人 们 眼中 的 彩色 


人 类 能 够 感受 到 的 物体 的 斋 色 是 由 物体 的 反射 
光 性 质 决 定 的 。 如 图 9.2 所 示 ， 可 见 光 是 由 电磁 波谱 
中 较 军 的 波段 组 成 的 。 一 个 物体 反射 的 光 如 果 在 所 
有 了 可见 光波 长 范围 内 是 平衡 的 ， 则 站 在 观察 者 的 角 
ВЕЖ АУ; 如 各 物体 仅 对 有 限 的 可 见 光 谱 苑 
围 反 射 ， 则 物体 表现 为 茶 种 特定 凑 色 。 例 如 ， 反 射 
波长 范围 在 450 一 500nm 之 间 的 物体 呈现 赣 色 ， 它 吸 
收 了 其 他 流 长 区 的 多 数 能 量 ;， 而 如 果 物 体 吸收 了 上 所 
有 的 入 射 光 ， 则 它 将 呈现 为 黑色 。 


可 
见 
R XIA 紫外 线 光 ”红外线 HRE 
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9.2 可见光 波长 范围 
з. 三 原色 


据 详 细 的 实验 结果 ， 人 眼中 负责 彩色 感知 的 细 
胞 中 约 有 65% 对 红 光 敏感 ，33% 对 绿 光 敏感 ， 而 只 
有 2% 对 蓝光 敏感 。 正 是 人 有 眼 的 这 些 吸 收 特 性 决定 
了 被 看 到 的 彩色 是 通常 所 请 的 原色 红 (R) , Ж 
(G). $ B) 的 各 种 组 合 。 国 际 照明 委员 会 
(CIE) 规定 以 蓝 =435.8nm， 绿 =546.1nm， 红 


=700nm 作 为 主 原 色 ， 红 (R). 2# (С), йй 
(B) 也 因此 被 称 为 3 原色 。 


在 如 图 9.3 所 示 的 CIE 色 上 度 图 中 ， 最 外 围 的 轮廓 
对 应 着 所 有 的 可 见 光 谱 色 ， 在 其 边缘 上 标 出 了 对 应 
的 波长 值 〈 以 nm 为 单位 ) ， 该 轮 廊 之 内 的 区 域 包含 
了 所 有 的 可 见 斋 色 。 如 果 将 色 度 多 中 的 三 色 点 两 两 
连接 成 一 个 三 角形 ， 则 该 三 角形 内 的 任何 颜色 都 可 
以 由 这 3 种 原色 的 不 同 泥 合 产生 。 





图 9.3 ”CIE 色 度 图 


可 以 看 到 ， 图 9.3 中 由 R、G、B 三 种 标准 原色 
所 连 成 的 三 角形 并 不 能 润 亩 整个 可 见 闫 色 区 域 ， 这 


说 明 仅 使 用 三 原色 并 不 能 得 到 所 有 的 可 见 凑 色 。 事 
实 上 ， 图 9.3 中 的 三 角形 区 域 对 应 着 典型 的 RGB 监 
视 需 所 能 够 产生 的 两 色 范 围 ， 称 为 彩色 全 域 ; 而 在 
FA 
PARTE 


4. ADF ERR 


ТЕТЯ, ERARE EKER) 
部 可 以 由 3 种 颜色 红 、 绿 、 蔓 组 成 ， 称 为 三 基色 。 
每 种 基色 的 取 值 范围 是 0 一 255。 任 何 颜 色 都 可 以 用 
这 3 种 闫 色 按 不 同 的 比例 混合 而 成 ， 这 就 古 三 原色 
原理 。 在 计算 机 中 ， 三 原色 的 原理 可 以 如 下 这 样 解 


FE 


。 ТИЛЛЕ НИЕ а а Д ВАЗЕ, FZ A" E] 
Ber pk; ПА EARE pA ye pk — Fl 
基本 闫 色 。 

三 原色 之 间 是 相互 独立 的 ， 任 何 一 种 闫 色 部 不 
能 由 其 余 的 两 种 颜色 来 组 成 。 

о 混合 色 的 饱和 度 由 3 种 颜色 的 比例 来 决定 。 混 合 
НЕЛЕ УЗИ А 


E БИТЕН УКА Е, и S ВЈ. 26. ВЈ ЕК 
为 三 色 值 ， 可 以 用 X、Y #lZ 分 别 表示 。 此 时 ， 一 
种 颜色 可 由 三 色 值 系数 定义 为 : 


了 十 1 十 z 一 ] 


9.2 ”彩色 模型 


彩色 模型 也 称 彩色 空间 或 彩色 系统 ， 古 用 来 精 
确 标 定 和 生成 各 种 闫 色 的 一 又 规则 和 定义 ， 它 的 用 
途 是 在 未 些 标准 下 用 通 币 可 接受 的 方式 和 侧 化 彩色 规 
Wo АЕМ Н E ГО ЖН ААА СУН, A 
ТНВ Е ñ H АА T [н] Ча HJ 88.4" Ж 
不 。 


如 今 使 用 的 大 部 分 彩色 模型 都 是 面 回 应 用 的 或 
是 面 同 便 件 的 ， 比 如 众所周知 的 针对 彩色 监视 妖 的 
RGB( 红 、 绿 、 蓝 ) 模型 ， 以 及 面 癌 彩色 打印 机 的 
CMY ( 青 、 深 红 、 黄 ) 和 CMYK ( 青 、 深 红 、 黄 、 
黑 ) 模型 。 而 HSI (色调 、 饱 和 度 、 亮 度 ) 模型 非 
币 符 合 人 有 眼 摘 述 和 解释 斋 色 的 方式 。 此 外 ， 目 前 广 
泛 使 用 的 彩色 模型 还 有 如 : HSV 模 型 、YUV 模 型 、 


YIQ 模 型 、Lab 模 型 ， 等 等 。 下 面 将 分 别 介绍 这 些 
彩色 模型 ， 并 给 出 它们 与 最 为 常用 的 RGB 模型 之 间 
的 转换 方式 。 


9.21 RGB 模型 


RGB 模型 是 工业 卉 的 一 种 颜色 标准 ， 是 通过 对 
红 (Red) 、 绿 (Green) „ їй (Blue) ЗА 
FEREARE EZ ЇН] lJ А 21 + Fl $ 
НУЛЕ НУ. ИЕЛЕ / AKI Т ВЕ КАП) 
HARE, HMHR MAER. 


1. 理论 基础 


RGB 彩色 空间 对 应 的 坐标 系统 是 如 网 9.4 所 示 
的 立方 体 。 红 、 绿 和 蓝 位 于 立方 体 的 3 个 顶点 上 
青 、 深 红 和 黄 位 于 男 外 3 个 顶点 上 ; 黑色 在 原点 
人 处， 而 昌 色 位 于 距离 原点 最 远 的 项 点 处 ， 而 灰 度 等 
级 束 沿 这 两 点 连 线 分 布 ; 不 同 的 闫 色 处 在 立方 体 上 
或 其 内 部 ， 因 此 可 以 用 1 个 3 维 回 量 来 表示 。 例 如 ， 
ра HKE, ПЕАТ К, AEn 
表示 为 0，0，1) ， 而 灰色 可 由 同 量 (0.5, 0.5, 
0.5) 来 表示 。 





9.4 RGB 彩色 立方 示意 图 


在 RGB 模型 中 ，3 个 图 像 分 量 组 成 了 所 要 表示 
的 图 像 ， 而 每 一 个 分 量 图 像 都 古 其 原色 图 像 ， 如 图 
9.5 所 示 。 当 送 入 RGB 监 视 占 时 ， 这 三 个 分 量 图 像 
便 在 屏 上 混合 产生 一 幅 合 成 的 彩色 图 像 。 
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(b) 红色 分 量 





(c) 绿色 分 量 (d) KENE 


图 9.5 RGB 图 像 的 3 个 分 量 ， 注 意 (а) 中 RGB 图 像 的 不 同 颜 
色 在 其 分 量 图 中 的 对 应 强度 


在 RGB 空 间 中 ， 用 以 表示 每 一 像 双 的 比特 数 叫 
作 像 素 深 度 。RGB 图 像 的 3 个 红 、 绿 、 效 分 量 图 像 
都 是 一 幅 8bit 图 像 ， 则 每 一 个 彩色 像 系 有 有 24bit 深 
上 度 。 因 此 ， 全 彩色 图 像 党 用 来 定义 24bit 的 彩色 图 
像 ， 颜 色 总 数 是 (28 )? =16777216. 


КСВ е Л. НОЛ з Й д от йт 6, Ж, 
HIRIT R EME МНА улаа НК. G. В 
数 信 来 驱动 R、G、B 电 子 枪 及 射 电子 ， 并 分 别 激 肥 
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RGB 彩色 空间 是 与 设备 相关 的 彩色 空间 ， 因 此 不 同 
的 扫 摘 仪 扫 摘 同 一 幅 图 像 ， 会 得 到 不 同色 彩 的 图 像 
数据 ， 不 同型 号 的 显示 器 显示 同一 幅 图 像 ， 也 会 有 
不 同 的 色彩 显示 结果 。 





u =s 


显示 项 和 扫描 仪 使 用 的 RGB 空间 与 CIE 标 准 中 RGB 呐 实 三 原色 彩 
色 系 统 空 间 是 不 同 的， 后 者 是 与 设备 无 天 的 彩色 空间 。 


2. MATLAB 实 现 


在 MATLAB 中 一 幅 RGB 图 像 可 表示 为 一 个 M 
xN x3 的 3 维 矩 阵 。 其 中 每 一 个 彩色 像 系 都 在 特定 空 
问 位 置 的 彩色 图 像 中 对 应 红 、 绿 、 葛 3 个 分 量 。 分 
量 图 像 的 数据 类 型 决定 了 它们 的 取 值 沁 围 。 奉 一 幅 
RGB 图 像 的 数据 类 型 是 double， 则 每 个 分 量 图 像 的 
取 值 沁 围 为 [0, 1]， 而 如 果 数 据 类 型 为 uint8 或 
uint16, WHERE Л ҤЕ АНИНЕ Уо Fs| 27212: [0, 255] 
或 [0, 65535]. 


。 图像 合成 


如 果 令 PR、PG、PB 分 别 代表 3 各 RGB 分量。 


那么 一 幅 RGB 图 像 束 是 利用 cat 级 联 ) 操作 符 将 这 
些 分 量 图 像 组 合成 彩色 图 像 ， 相 关 代 人 码 如 下 。 





注意 在 上 述 cat 操 作 中 ， 图 像 应 按照 R、G、B 的 
页 序 放置 。 如 果 所 有 的 分 量 图 像 都 相等 ， 则 结果 将 
КЛ. 


ТЩ 


° еН 


令 RGB_image 代 表 一 幅 RGB 图 像 ， 下 面 的 命令 
可 以 提取 3 个 分 量 图 像 。 


PR=RGB_image(:,:,1); 
PG=RGB image(:,:,2); 


PB=RGB_image(:,:,3); 





3. Visual C++ 实现 


可 以 使 用 安 来 方便 地 进行 RGB 图 像 的 合成 与 分 


量 近 取 。 


。 图像 合成 


RGB_image = RGB(PR, PG, PB); // 合 成 RGB 图 像 ，PR、PG、PB 均 


在 6~255 之 间 





ЛЕН 


GetRValue(RGB image); // 提 取 红 色 分 量 
GetGValue(RGB image); // 提 取 绿 色 分 量 


GetBValue(RGB image); // 31 77 





9.2.2 CMY, CMYK 
1. СМҮ Ж 


CMY (Cyan, Magenta, Yellow) 模型 是 采用 
Ao ин, ЕЗЕК 16 E ШҮ ЛИРИ, 
的 方法 。 由 于 色彩 的 显示 不是 直接 来 和 目 于 光线 的 色 
彩 ， 而 是 光线 航 物 体 吸收 挥 一 部 分 之 后 反射 回来 的 
剩余 光线 所 产生 的 ， 因 此 CMY 模 型 义 称 为 减 色 法 混 
Ce 部 和 被 反射 时 


像 CMY 模 型 这 样 的 减 色 混合 醒 型 正好 适用 于 
彩色 打印 机 和 复印 机 这 类 十 要 在 纸 上 沉 积 彩 色 闫 料 
的 设备 ， 因 为 颜料 不 是 便 显 示 货 那样 及 出 颜色 ， 而 
хе) Л. Д, ЕВН НН АЭ 


ЙН, JAZ BL ДИП УЕЛ, Пе ЉБВ 
日 光 中 减 去 红色 而 得 到 的 青色 (日 光 本 里 是 等 量 的 
红 、 绿 、 蓝 光 的 组 合 ) 。CMY 模 型 的 颜料 混合 效果 
如 图 9.6 所 示 ， 注 意 这 里 的 混合 是 原色 的 相 减 ， 与 
RGB 模型 的 混合 正好 相反 。 


2. CMYK EZ 


H 9.6197 И, За ЧЕЛА Е Сы, mM 
黄 ) 可 以 混合 产生 黑色 。 然 而 在 实际 当中 ， 通 过 这 
些 项 色 混 合 产生 的 黑色 是 不 纯 的 。 因 此 ， 为 产生 真 
下 的 黑色 (黑色 在 打印 中 起 主要 作用 〉 ， 专 门 在 
CMY 模 型 中 加 入 了 第 4 种 闫 色 一 一 黑色 ， 从 而 得 到 
了 CMYK 彩 色 模 型 。 这 样 当 出 版 商 说 到 “四 色 打 
印 ? 时 ， 是 指 CMY 彩 色 模 型 的 3 种 原色 再 加 上 黑色 。 





=E: 
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图 9.6 ”CMY 模 型 的 颜色 混合 (原色 相 减 ) 
3. RGB 与 CMY 之 间 的 转换 及 其 实现 


RGB 与 CMY 之 间 的 转换 公式 如 下 : 


ш S) е 





ПЕЧЕ ИН 


Жн, BRERA WJ EEA СЯ — 06 Жш. El 
[0,1]. 








• MATLAB 实 现 


在 MATLAB 中 可 iM ітсотріетепі()24 #77 
便 地 实现 RGB 和 CMY 之 间 的 相互 转换 ， 调 用 代码 
如 下 。 


сту = imcomplement (rgb); 
гер = imcomplement (сту); 


° Visual C++ 实现 


下 面 给 出 Visual C++ 中 从 RGB 转换 到 CMY 的 代 
伺 实 现 ， 它 同样 也 适用 于 从 CMY 到 RGB 的 转换 。 





u SSK I SSES ы 

void CImgProcess::RGB2CMY(CImgProcess *pTo) 

功能 : ”把 一 幅 RGB 图 转 CMY 图 

参数 : СІтеРгосеѕѕ* pTo: 目标 输出 图 像 的 CImgProcess ЎН 


0 


void CImgProcess::RGB2CMY(CImgProcess *pTo) 


int nHeight = GetHeight(); 

int nWidth = GetWidthPixel(); 

int i, j; 

for(i=0; i<nHeight; 1++) 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 

// 抽 取 RGB 分 量 

int R 

int G 

int B 
C 


GetRValue(RGBPixel); 

GetGValue(RGBPixel); 

GetBValue(RGBPixel); 
›Ү; 


<< H H li 


= 255 - R; 
M = 255 - G; 
= 255 - B; 


/ [KN ERARE CMY [<| @ 
pTo->SetPixel(j, i, RGB(C, M, Y)); 
}//for j 
}//for i 
J 


利用 RGB2CMY0 函 数 实现 色彩 模型 转换 的 完 
整 示 例 被 封装 在 DIPDemo 工 程 中 的 视图 类 消 数 void 
CDIPDemoView::OnColorCmy2rgb()， 其 中 调用 
RGB2CMY0 函 数 的 代码 请 断 如 下 所 示 : 


// 检查 图 像 是 RGB 图 像 
if (imgInput.m pBMIH->biBitCount!=24) 


AfxMessageBox(" 不 是 RGB 图 像 ， 无 法 处 理 ! "); 
return; 


) 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// RGB2CMY 
imgInput.RGB2CMY(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





旋 者 可 以 通过 光一 中 示例 程序 DIPDemo 中 的 采 
单 命 令 “ 彩 色 图 像 处 理 “CMY2RGB” 来 观察 处 理 效 
Ж 


О 


[9.1] 从 RGB 转换 到 CMY。 


下 面 将 RGB 阁 像 plane.bmp 转 换 到 CMY 衬 间 
下 ， 结 果 如 网 9.7 所 示 。 为 了 观察 效果 ， (b) 中 的 
独 像 是 把 CMY 分 量 直 接 以 RGB 格式 来 显示 的 ， 而 
事实 上 转换 只 是 同一 幅 图 像 在 不 同色 彩 空间 中 的 两 
25 u E — EA n] Д Е T [aj Җ ЖИЙДЕ HH ün 
Ду Лр 





(a) 原 图 像 plane.bmp (b) 转换 后 的 CMY 图 像 〈 以 RGB 的 格式 来 显示 ) 


9.7 RGB#EOCMYA M|] 
9.2.3 HSI 模 型 


HSI 模 型 是 从 人 的 视觉 系统 出 友 ， 和 下 接 使 用 周 
а= 色调 (Hue) „ WAME (Saturation ) 
ME CIntensity, AH EENS ЕНИ Л) Ж 
AIEE, o 


° TREMA RE EGAT o JGA RE EER 
K, ZERK 

。 包 调 是 彩色 最 重要 的 属性 ， 诀 定 颜 色 的 本 质 ， 
由 物体 反射 光线 中 后 优势 的 波长 来 决定 ， 不 同 
的 波长 产生 不 同 的 颜色 感觉 ， 叫 东 一 种 颜色 为 
红 、 橙 、 黄 ， 这 融和 是 说 谈 者 在 规定 一 种 色调 。 

о WMR АИА ДУТО ТИС Е, ПЕЕ К 
mo MERR. WAR RRA A E ЕЯ 
K, НЕ, WME RR. 
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图 9.8 ”HSI 模型 示意 


由 于 人 的 视觉 对 腕 度 的 敏感 程度 远 强 于 对 两 色 


ИС ДУВЕ Е, J Г ИЛЕЛИН, AH 
Мт 26 ЕНН ETE], = ERGB ET 
间 更 符合 人 的 视觉 特性 。 此 外 ， 由 于 HSI 空 间 中 况 
度 和 色 度 具有 可 分 离 特 性 ， 使 得 图 像 处 理 ” 和 机 器 
视 党 中 大 量 灰 上 度 处 理 算 法 都 可 在 HSI 彩 色 空 间 中 方 
便 地 使 用 。 


HSTI 彩 色 空 间 和 RGB 彩色 空间 只 是 同一 物理 量 
的 不 同 表 示 法 ， 因 而 它们 之 间 存 在 着 转换 关系 。 下 
面 将 介绍 一 下 ，RGB 到 HSI 的 彩色 转换 和 HSI 到 
RGB 的 彩色 转换 。 
1. 从 RGB 到 HSI 的 彩色 转换 及 其 实现 


给 定 一 幅 RGB 格 式 的 图 像 ， 每 一 个 RGB 像 系 和 
H DÆ H TAARE SI]: 


[ BBG) 
Ha ` 
|360- 8.(B > G) 


(9-1) 
此 处 


=! 8-а) + (8 В) 
үйө ын єс нг 


饱和 度 分 量 由 下 式 给 出 : 


S=1— _ 0000 шщ R. G. В) 
[R+G+ В) 
(9-2) 
Hei, BENEN: 
7 въаъ+ в) 
3 
(9-3) 


假定 RGB 值 归 一 化 为 [0，1] 范 围 内 ， 色 调 可 以 
用 式 (9-1) 得 到 的 值 除 以 360° 归 一 化 为 [0，1] 沁 围 
内 ， 而 其 他 两 个 HSI 分 量 已 经 在 [0，1] 范 围 之 内 。 


。MATLAB 实 现 
下 面 给 出 一 个 实现 RGB 转换 到 HSI 的 MATLAB 


图 数 rgb2hsi0， 旋 者 可 以 在 附 赠 光 盘 的 第 9 章 的 code 
H>< rH 26. 





function hsi = rgb2hsi(rgb) 

% hsi = rgb2hsi(rgb) 把 一 幅 RGB 图 像 转换 为 HSI 图 像 ， 

% 输入 图 像 古 一 个 彩色 像 系 的 MxNx3 的 数组 ， 

% 其 中 每 一 个 彩色 像 系 避 在 特定 空间 位 是 的 彩色 图 像 中 对 应 红 、 绿 、 
1 — Ax E 


"77 ŒE o 


% 假如 所 有 的 RGB 分 量 是 均衡 的 ， 那 么 HSI 转 换 束 是 未 定义 的 。 


% 输入 图 像 可 能 是 double《〈 取 值 范 围 是 [6，1]) ，uint8 或 uint16 


6 输出 HSI 图 像 是 double， 
% 其 中 hsi(:，:，1) 是 色 度 分 量 ， 它 的 范围 是 除 以 2*pi 后 的 [6，1] 


% hsi(:，:，2) 是 饱和 度 分 量 ， 范 围 是 [6，11: 
% hsi(:, :, З) 878, їп] [0Ө, 1]. 


% 抽取 图 像 分 量 

rgb = im2double(rgb); 
г = Рв0(:, :, 1); 

g = rgb(:, :, 2); 

b = pPgb(:, :, 3); 


% 执行 转换 方程 
пит = @.5*((r - g) + (r - b)); 

den = sqrt((r - g). ^2 + (r - b).*(g - b)); 
theta = acos(num./(den + eps)); % 防 止 除数 为 6 


H = theta; 
H(b > g) = 2*pi - H(b > g); 
H = H/(2*pi); 


num = min(min(r, g), b); 

den = r + g + b; 

den(den == 0) = eps; % 防 止 除数 为 6 
S=1- 3.* пим. /аеп; 


H(S == 0) = Ө; 
I = (r + р + b)/3; 


% 将 3 个 分 量 联合 成 为 一 个 HSI 图 像 
hsi = cat(3, H, S, I); 





下 面 是 一 个 调用 rgb2hsiO0 函 数 的 程序 段 ， 它 将 
RGB 图 像 plane.bmp 转 换 至 HSI 空 间 。 


>>figure; 

subplot(1,2,1); 
rgb=imread('plane.bmp'); 
imshow(rgb);title('rgb'); 


subplot(1,2,2); 
hsi=rgb2hsi(rgb); 
imshow(hsi);title('hsi'); 





转换 效 来 如 图 9.9 所 示 。 





(a) RGB 原 图 (b) 转换 后 HSI 图 〈 以 RGB 格式 显示 ) 


图 9.9 RGB 转 HSI 效 果 图 
• Visual C++ 实现 
利用 Visual C++ 将 一 幅 RGB 图 像 转换 为 HSI 图 


WJ SAKHI К. 


站 


void CImage: :RGB2HSI(CImage* pTo) 


功能 : ”把 一 幅 RGB 图 像 转换 为 HSI 图 像 

参数 : СІтаре* pTo: Н Н АУ CImage 指针 
RP: 无 

下 


void CImage: :RGB2HSI(CImage* pTo) 
{ 


int nHeight = GetHeight();// 读 取 图 片 高 度 
int nWidth = GetWidthPixel();// 读 取 图 片 宽度 


int i, J; 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 


// 抽 取 RGB 分 量 

double R = GetRValue(RGBPixel)/255.0; 
double G = GetGValue(RGBPixel)/255.0; 
double B = GetBValue(RGBPixel)/255.0; 


//RGB2HSI 的 算法 转换 

double maxRGB = max(max(R,G),B); 
double minRGB = min(min(R,G),B); 
double H; 

double S; 

double 工 ; 

double Templ,Temp2,Radians,Angle; 


I = (R+G+B)/3; 


if(I<0.078431) 
S=0; 

else if(I>0.920000) 
S=0; 

else 
S=1.0-(3.0*minRGB)/(R+G+B); 


if(maxRGB==minRGB) 
l 

H = ð; 

S = Ө; 
J 


Temp1 = ((R-G)+(R-B))/2; 
Temp2 = (R-G)*(R-G)+(R-B)*(G-B); 
double Q = Templ/sqrt(Temp2); 
if(Q>0.9999999999) // 由 于 存在 误 甜 ， 所 以 设 定 Q 大 于 茶 个 
不 为 1 的 值 时 ， 认 为 0 为 1。 
Radians = 0; 
else if(Q<-0.9999999999) // 由 于 存在 误 产 ， 所 以 设 定 Q@ 小 
于 茶 个 不 为 -1 的 全 时 ， 认 为 Q 为 -1。 
Radians = PI; 
else 
Radians = acos(Q); 
Angle = Кааіапѕ*180.0/РІ; 
if(B>G) 
H = (360.0-Angle); 
else 
H = Angle; 


255715 
©: =: 2555; 


ч 
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// 将 分 量 联合 形成 HSI 图 像 
pTo->SetPixel(j, i, RGB(H, S, I)); 


} 
} 
} 





函数 rgb2hsi() 的 调用 方式 如 下 。 


// RGB2HSI 
imgInput.RGB2HSI(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





记 者 可 以 退 过 光 可 中 示例 程序 DIPDemo 中 有 的 采 
单 命令 “彩色 图 像 处 理 , RGB2HSI”* 来 观察 处 理 效 
R, 


2. 从 HSI 到 RGB 的 彩色 转换 及 其 实现 


在 [0，1] 内 给 出 HSI 值 ， 现 在 要 在 相同 的 值 域 
内 找到 RGB 值 ， 可 利用 互 值 公式 。 在 原始 色 分 制 中 
有 3 个 相隔 120° 的 届 形 ， 如 图 9.10 所 示 。 从 五 乘 以 
360?" 开 始 ， 这 时 色调 值 返 回 原来 的 [0"，360?] 的 苑 
围 。 


RG (0°<H <120°) : нг TX Кх 
时 ，RGB 分 量 由 下 式 给 出 : 


В=1Ц(1—5) 
р т\з 5 cos H 
Е соѕ160° 一 Н) 


(tz=3j3[I — IR + B) 


绿 黄 绿 黄 
f Е (5) Е 
w 深 红 蓝 深 红 


49.10 ”HSI 模 型 中 的 色调 和 饱和 度 





GB 局 区 (120°<H <240°) : WRA EH E 
这 一 忆 区 ， 首 先 从 五 中 减 去 1202"， 即 : 


H = H — 120° 


然后 RGB 分 量 为 : 


5 cos H 
ча cos(60° — H) 


В (ЕАС) 


ВЕ ІХ (240°<Н <360°) : Жл, WH X 
1х, MH 中 减 去 240°: 


H = H — 240° 
y ЕЯ. > 
然后 RGB 分 星 为 : 
(а = {1 — 5) 
arli 5 cos H 
Е у сов 60° 一 H) 


R =3I — (G + В) 
° MATLAB 实 现 


下 面 给 出 一 个 实现 HSI 转 换 到 RGB 的 MATLAB 
鸭 数 hsi2rgb0， 访 者 可 以 在 附 赠 光盘 的 第 9 草 的 code 
目录 中 找到 它 。 





function rgb = hsi2rgb(hsi) 
% rgb = hsi2rgb(hsi) 把 一 幅 HSI 图 像 转换 为 RGB 图 像 ， 
% 其 中 hsi(:，:，1) 是 色 度 分 量 ， 它 的 范围 是 除 以 2*pi 后 的 [6，1] 


% 
% 
% 
% 
% 
% 
% 


hsi(:，:，2) 是 饱和 及 分 量 ， 沁 围 是 [6，1]; 
hsi(:, :, 3з) иш, Ў: 80, 1]. 


ЖН ЖЛ =: 

rgb(:，:，1) 为 红 ; 
rgb(:，:，2) 为 绿 ; 
rgb(:，:，3) 为 蓝 。 


% 抽取 图 像 分 量 
hsi = im2double(hsi); 


Н = hsil :, 1) ® 2 *- рі; 
S = һ51(:, :, 2); 
L = ПБТ 2; 305 


% 执行 转换 方程 

zeros(size(hsi, 1), size(hsi, 2)); 
zeros(size(hsi, 1), size(hsi, 2)); 
zeros(size(hsi, 1), size(hsi, 2)); 


о G 2 
пи I 


% RG 肩 形 (@ <= H < 2*рі/3) 

idx = Ғіпа( (Ө <= Н) & (Н < 2*pi/3)); 

B(idx) = 1(1іах) .* (1 - S(idx)); 

R(idx) = І(іах) .* (1 + 5(іах) .* соѕ(Н(іах)) ./ ... 
соѕ(рі/3 - H(idx))); 

G(idx) = 3*I(idx) - (R(idx) + B(idx)); 


% BG JÉ (2*pi/3 <= H < 4*pi/3) 
idx = find( (2*pi/3 <= H) & (H < 4*pi/3) ); 


R(idx) = I(idx) .* (1 - S(idx)); 
G(idx) = I(idx) .* (1 + S(idx) .* cos(H(idx) - 2*pi/3) 
"w gek 


cos(pi - H(idx))); 
B(idx) = 3*I(idx) - (R(idx) + G(idx)); 


% BR 扇形 

idx = find( (4*pi/3 <= H) & (H <= 2*р1)); 

G(idx) = I(idx) .* (1 - S(idx)); 

B(idx) = I(idx) .* (1 + S(idx) .* cos(H(idx) - 4*pi/3) 
o же, 

cos(5*pi/3 - H(idx))); 

R(idx) = 3*I(idx) - (G(idx) + B(idx)); 

% 将 3 个 分 量 联合 成 为 一 个 RGB 图 像 
rgb 


gb = cat(3, R, G, B); 


ш = max(min(rgb, 1), ө); 


下 面 是 一 个 调用 hsi2rgb() 函 数 的 程序 段 ， 实 现 
了 HSI 到 RGB 的 彩色 转换 。 


>>figure; 

subplot(1,2,1); 

hsi=imread('hsi.jpg'); %RGB 图 像 plane.bmp 转 换 至 his 空 间 后 的 
图 像 

imshow(hsi);title('hsi'); 


subplot(1,2,2); 
rgb=hsi2rgb(hsi); 
imshow(rgb);title('rgb'); 





ЖЕТА Ja HIAR К9.11РТлх 





(а) HSI 原 图 〈 以 RGB 格式 显示 ) (b) 转换 后 RGB 图 
图 9.11 HSI 转 RGB 效果 图 


• Visual C++ 实现 


利用 Visual C++ 把 一 幅 HSI 图 像 转 换 为 RGB 网 
像 的 相关 代 但 如 下 。 


ЕО 


void CImage::HSI2RGB(CImage *рТо) 
功能 : ”把 一 幅 HSI 图 像 转换 为 RGB 图 像 
参数 : СІтаре* pTo: Н Н АУ CImage 指针 
返回 值 : 无 
ed КЕЕ А 
void CImage::HSI2RGB(CImage *pTo) 
l 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


int i, J; 


for(i=0; i<nHeight; i++) 
{ 
for(j=0; j<nWidth; j++) 
{ 
COLORREF RGBPixel = GetPixel(j, i); 
// 抽 取 HSI 分 量 
double H = GetRValue(RGBPixel); 
double S = GetGValue(RGBPixel)/255.0; 
double І = GetBValue(RGBPixel)/255.0; 
double R,G,B; 


//HSI2RGB 的 算法 转换 
if(H>=0 && H<120) 
{ 
= Н; 
1*(1.0-5); 
= 1*(1.0+((5*соѕ(Н) ) /соѕ(60-Н))); 
= 3.0*I-R-B; 


бу — о І 
| 


J 
else if(H>=120 && H<240) 


{ 
Н = Н-120; 
R = 1%*(1.0-5); 
G = 1*%*(1.0+((5*соѕ(Н))/соѕ(60-Н))); 
В = 3.0*I-R-G; 
J 
else 
{ 


Н = Н-240; 

G = 1*(1.0-5); 

В = 1*%(1.0+((5*соѕ(Н))/соѕ(60-Н))); 
R = 3.0*I-B-G; 


*=255.0; 
*=255.0; 
*=255.0; 


g G) J = 


// 将 分 量 联合 形成 RGB 图 像 
pTo->SetPixel(j, i, RGB(R, G, B)); 


国 数 hsi2rgbO 的 调用 方式 如 下 。 





// HSI2RGB 
imglnput.HSI2RGB(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


| 


读者 可 以 通过 光 礁 中 示例 程序 DIPDemo 中 的 采 
单 命令 “彩色 图 像 处 理 _ ,HSI2RGB” 来 观察 处 理 效 
R, 


02.4 HSV 模 型 


HSV 模 型 是 人 们 用 来 从 调 色 板 或 颜色 轮 中 挑选 
EE СШ ЛЫ EKE) 所 采用 的 彩色 系统 之 
一 。HSV (Hue, Saturation, Value) 表示 色调 (也 
称 色 相 ) 、 饱 和 度 和 数值 。 该 系统 比 RGB 更 接近 于 
人 们 的 经 验 和 对 彩色 的 感知 。 在 绘画 术语 中 ， 色 
调 、 饱 和 度 和 数值 用 色泽 、 明 上 蜡 和 调 色 来 表达 。 


HSV 模 型 空间 可 以 用 一 个 倒立 的 六 校 锥 来 摘 
Ж, ИШ 9.12/7лх„ М ТЕУЛЖ, WH 77 
问 表 示 色 相 的 变化 ， 从 0 一 360" 是 可 见 光 的 全 部 色 
说 。 六 边 形 的 六 个 角 分 别 代 表 红 、 页 、 绿 、 育 、 
监 、 品 红 6 个 凑 色 的 位 置 ， 每 个 斋 色 之 间 相 隅 60"。 
由 中 心 同 六 边 形 边界 〈S 方 同 ) ИЛЕН 
А, З 的 值 由 0 一 1 变化 ， 越 接近 六 边 形 外 框 的 两 
色 饮 和 撒 越 高 ， 人 处 于 六 边 形 外 框 的 颜色 是 饱和 上 度 最 
高 的 颜色 ， 即 S$S =1; 处 于 六 边 形 中 心 的 闫 色 饱 和 上 度 
为 0， 即 $ =0. KRIE СЕ) ШУ Ж 
示 ， 它 从 下 至 上 和 示 一 条 由 黑 到 日 的 灰 度 ，YV 的 瓜 


WERE, У=0; УНЕ Н, У=1. 
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图 9.12 HSV 的 六 棱锥 模型 
1. 从 RGB 到 HSV 的 转换 及 其 实现 


假设 所 有 的 颜色 值 都 已 经 归 一 化 到 范围 [0， 
1]。 在 RGB 三 个 分 量 中 ， 设 定 最 大 的 为 MAX， 最 小 
的 为 MIN。RGB 到 HSV 的 转换 公式 为 : 
MAXSMIN х 60°, (R = МАХ) 


Н = | [2 + тахту) х 60°. (С = M AX) 
(4+ aur) x 60°, (В = МАХ) 


МАХ — MIN 
MAX 


D == 
V = МАХ 


ПЖ, H НМЕ  2у0°7—360°, 5 МУ 


全 范围 为 0 一 1。 
ШЖМАХ=МІЧ, Н= 9 0, WARE. 
WRH <0°, UH Iñ 70 360°. 
如 果 MAX=0，S =0 就 是 没有 色彩 。 
如 果 V=0 则 是 纯 圭 色 。 
。MATLAB 实 现 


在 MATLAB 中 RGB 转 为 HSV 的 函数 为 
rgb2hsv()， 其 调用 方式 如 下 。 


hsv = rgb2hsv(rgb); 


输入 的 RGB 图 像 可 以 是 uint8、uint16 或 double 
类型 的 。 


输出 图 像 hsv 为 M xN x3 的 double 类 型 。 
° Visual C++ 实现 


利用 Visual C++ 把 一 幅 RGB 图 转 为 HSV 图 的 相 
天 代码 如 下 。 





iii u ЕЕЕ ЕЕ ЕЕЕ ЕЕЕ ТЕ 


void CImage::RGB2HSV(CImage *pTo) 

功能 : ”把 一 幅 RGB 图 转 HSV 图 

参数 : СІтаре* pTo: 目标 输出 图 像 的 CImage 指针 

返回 值 : 无 

ЖЕКЕ Tm DT Tr ЕТЕ EE 

void CImage: :RGB2HSV(CImage *pTo) 

{ 
int nHeight = GetHeight(); // 取 得 图 像 高 度 
int nWidth = GetWidthPixel(); // 取 得 图 像 完 上 度 


int i, j; // 循 环 变 量 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 
// 抽 取 RGB 分 量 
double R = GetRValue(RGBPixel)/255.0; 


double G = GetGValue(RGBPixel)/255.0; 
double B = GetBValue(RGBPixel)/255.0; 
// 计 算 HSV 


double H,S,V,MAX,MIN ,TEMP ; 
MAX = max(max(R,G),B); 

MIN = min(min(R,G),B); 

V = MAX; 

TEMP = MAX - MIN; 


if(MAX != 0) 
l 

S = TEMP/MAX; 
J 


{ 
S. = 0; 
//H = UNDEFINEDCOLOR; 
return; 


if(R == MAX) 
= (G - B)/TEMP; 
else if(G == MAX) 
Н = 2 + (В - R)/TEMP; 
else 
Н = 4 + (R - G)/TEMP; 
H *=60; 
if(H < Ө) 
Н +=360; 


/将 HSV 分 量化 为 能 在 计算 机 上 显示 的 量 


// 将 分 量 联合 形成 HSV 图 像 
pTo->SetPixel(j, i, RGB(H, S, V)); 
J 
J 
} 


А) Н rgb2hsv( A 56 G6,3Z А [К] ЕЛ JS 
Р 7287 ТРОето Г. F НА Е 2 РА 22void 
CDIPDemoView::OnColorRgb2hsv() 中 ， 其 中 调用 
rgb2hsvOPR И АТАП F РТУ o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// RGB2HSV 


imgInput.RGB2HSV(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “彩色 图 像 处 理 “RGB2HSV” 来 观察 处 理 效 
果 ， 转 换 后 的 效果 如 图 9.13 所 示 。 





(a) RGB 原 图 (b) 转换 后 HSV 图 〈 以 RGB 的 格式 显示 ) 
图 9.13 ”RGB 转 HSV 效 果 图 

2， 从 HSV 到 RGB 的 转换 及 其 实现 

假设 HSV 需 色 全 已 转换 为 这 个 范围 : 五 的 值 为 
0°~360°, S 和 立 值 为 0 一 1。 则 HSV 到 RGB 的 转换 
公式 如 下 。 

假如 S =0， 则 R 、G 、B 值 的 计算 公式 为 : 

R=G =B =V 


假如 5 #0， 则 R、G 、B 值 的 计算 公式 为 : 


中 一 有 (1 一 了 5 
=\М(1—(1— f)5) 

HFH =V G =L B =Pn,(i=0) 
H =qg, G= V.B =p,GG = 1! 
ЕЕ Beki 
Ff= p 7 = q. B = V. li = 3) 
R= į G = p, B = V, G = 4) 


fe == G=p а 
计算 结果 中 ，R 、G 和 B 值 范围 为 0 一 1。 
° MATLAB 实 现 


在 MATLAB 中 HSV 转 RGB 的 函数 为 hsv2rgb0)， 
其 调用 方式 如 下 。 


rgb = hsv2rgb(hsv); // 输 入 输出 图 像 均 为 double 类 型 


° Visual C++ 实现 


利用 Visual C++ 把 一 幅 HSV 图 转 为 RGB 图 的 相 
天 作风 好 К. 


JY YE ЕЕЕ ЕЕ ЕЕЕ ЕЕЕ 


void CImage: :HSV2RGB(CImage *pTo) 
功能 : НУ КСВ 
参数 : СІтаре* pTo: Н Н АУ CImage 指针 
返回 值 : 无 
To Tm DT Tr у 
void CImage: :HSV2RGB(CImage *pTo) 
{ 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 
int i, J; 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 

// 抽 取 HSV 分 量 

double H = (GetRValue(RGBPixel)/255.0)*360.0; 
double S = GetGValue(RGBPixel)/255.0; 

double V = GetBValue(RGBPixel)/255.0; 


// 计 算 RGB 

double R,G,B,f,p,q,t,TEMP; 
int n; 

Jf(S == Ө) 


n = floor(H/60); 
TEMP = H/66; 

= [EMP - n; 
V*(1-S); 
V*(1-f*S); 

= V*(1-(1-f)*S); 


бсо 5 + 
lI 


switch(n) 


{ 
case Ө: 
К V; 
G = t; 
B = p; 
preak; 
case 1: 
R = q; 
G = V; 
B = p; 
break; 
case 2: 
R = p; 
G = V; 
B = t; 
break; 
case 3: 
R = p; 
G = q; 
B = V; 
break; 
case 4: 
R = 5 
о = р; 
В = V; 
ргеак; 
default: 
R = V; 
G = p; 
B = q; 
break; 
} 
R *=255.0; 


//case 5: 


B *=255.0; 


// 将 分 量 联合 形成 RGB 图 像 
pTo->SetPixel(j, i, RGB(R, G, B)); 
}//for j 
}//for i 
J 





利用 hsv2rgb() 函 数 实现 色彩 模型 转换 的 完整 示 
例 被 封 汉 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView::OnColorHsv2rgb() 中 ， 其 中 调用 
hsv2rgb() A 211015 r r ill F PS 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// HSV2RGB 
imgInput .HSV2RGB(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





旋 者 可 以 通过 光一 中 示例 程序 DIPDemo 中 的 采 
单 命令 “彩色 图 像 处 理 HSV2RGB” 来 观察 处 理 效 
果 ， 转 换 后 的 效果 如 图 9.14 所 示 。 





(a) HSV 图 (b) 转换 后 RGB 图 


49.14 HSV 转 RGB 效果 网 


与 HSI 转 RGB 效果 相 比 ，HSV 转 RGB 的 效果 明 
显 更 好 ， 并 且 可 以 快速 、 高 效 地 实现 。 所 以 ， 在 实 
际 中 RGB 和 HSV 的 可 逆转 换 往 往 比 RGB 和 HSI 的 可 
地 转换 使 用 得 更 多 。 


9.2.5 YUV 模 型 


YUV 是 被 欧洲 电视 系统 所 采用 的 一 种 颜色 编码 
方法 ， 是 PAL 和 SECAM 模 拟 彩 色 电 视 制式 采用 的 
颜色 空间 。 其 中 的 Y、U、V 几 个 字母 不 是 英文 单词 
的 组 合 词 ，Y 代表 亮度 ，U 、V 代表 色差 ， 是 构成 
彩色 的 两 个 分 量 。 


彩色 图 像 信 号 经 分 色 和 分 别 放 大 校正 得 到 RGB 
图 像 ， 再 经 过 矩阵 变换 电路 得 到 亮度 信号 了 和 两 个 
色差 信号 R —Y. B 一 Y， 最 后 发 送 端 将 亮度 和 色 


天 3 个 信号 分 别 进行 编码 ， 用 同一 信道 用 送出 去 。 
XE E H ASY UVER H 


采用 YUV 模 型 的 一 个 主要 优势 是 它 的 亮度 信和 号 
Y 和 人 色 友 信 写 U、V 是 分 离 的 。 如 果 只 有 Y 信 号 分 
量 而 没有 U、V 分 量 ， 那 么 这 样 表示 的 图 束 古 黑白 
灰 度 图 。 彩 色 电 视 采 用 YUV 空 间 正 是 为 了 用 亮度 信 
写 了 解决 彩色 电视 机 与 黑白 电视 机 的 兼容 问题 ， 使 
和 白 电 视 机 也 能 接收 彩色 信号 ， 如 网 9.15 所 示 。 






SQ E 
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黑白 电视 机 





图 9.15 YUV 模 型 应 用 示意 图 


МААЛ HY RRR, EMA Эк, їй 
= АЈА АЈНА ККУ: Y =0.299R 
+0.587G +0.114B , Xæ ws НАЧЕЛА. 20 
‚ VEHIB —Y. R — Y PAA E EAA о РН. 如 
果 要 由 YUV 空 间 转 化 成 RGB 空间 ， 只 要 进行 相反 的 
了 运算 即 可 。 


1. 从 RGB 到 YUV 的 转换 及 其 实现 
Y =0.299R +0.587G +0.114B 
U =0.567(B -Y ) 
V =0.713(R -Y ) 
° MATLAB 实 现 
本 书 编写 了 rgb2yuv0O 函 数 ， 实 现 从 rgb 同 yuv 的 


转换 。 谈 者 可 以 在 付 赠 光 盘 第 9 章 的 code 目 隶 中 找 
到 文件 “rgb2yuv.m”。 相 天 代码 如 下 。 





function yuv = rgb2yuv(rgb) 

% yuv = rgb2yuv(rgb) 把 一 幅 RGB 图 像 转 换 为 YUV 图 像 ， 

% 输入 图 像 是 一 个 彩色 像 系 的 MxNx3 的 数组 ， 

% 其 中 每 一 个 彩色 像素 都 在 特定 空间 位 置 的 彩色 图 像 中 对 应 红 、 绿 、 


И, 


% 假如 所 有 的 RGB 分 量 是 均衡 的 ， 那 么 HSI 转 换 就 是 未 定义 的 。 
% 输入 图 像 可 能 是 double《〈 取 值 范围 是 [6，1]) ，uint8 或 uint16 


% 

% 输出 YUV 图 像 是 uint8。 
rgb = im2double(rgb); 
ED x, 355 

g = rgb(:, :, 2); 

b = reol Фу 5)5 


% 执行 转换 函数 

y = 0.299*r + 0.587*g + 0.114*b; 
u = 0.567*(b - y); 

v = 0.713*(r - у); 


% 防止 溢出 
if(y < 0) 
y = 0; 
end; 
if(y > 1.0) 
y = 1.0; 


end; 
if(u > 1.0) 
u = 1.0; 
end; 
if(v < Ө) 
v = 0; 
end; 
if(v > 1.0) 
v = 1.0; 
end; 


% 联合 yuv， 并 转 成 uint8 关 型 
y = y*255; 
u 
V 


u*255; 
= \/®255; 


cat(3, y, u, v); 
uint8(yuv); 


yuv 
yuv 





° Visual C++ 实现 


利用 Visual C++ 把 一 幅 RGB 图 转换 为 YUV 图 的 
相关 代码 如 下 。 


ОЕТ Ее 


void CImage: :RGB2YUV(CImage *рТо) 
功能 : 把 一 幅 RGB 图 转 YUV 图 


参数 : CImage* pTo: 目标 输出 图 像 的 CImage 指针 
返回 值 : 无 


ЕР 
void CImage: :RGB2YUV(CImage *рТо) 


{ 
int nHeight = GetHeight(); 


int nWidth = GetWidthPixel(); 
int i, j; 

for(i=0; i<nHeight; i++) 

ү for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 


// 抽 取 RGB 分 量 
double R = GetRValue(RGBPixel); 
double G = GetGValue(RGBPixel); 


double B = GetBValue(RGBPixel); 


// 计 算 YUV 


double Y,U,V; 

Y = 0.299*R + 0.587*G + 0.114*В; 
U (B - Ү)*0. 567; 

V (R - Y)*0.713; 


/ ЕФ ЕН 
if(Y > 255) 
Y = 255; 

if(Y < Ө) 

y =o: 
if(U > 255) 
U = 255; 

if(U < Ө) 

U = Өө; 
if(V > 255) 
V = 255; 
if(V < Ө) 
V = Ө; 


// 将 分 量 联合 形成 YUV 图 像 
pTo->SetPixel(j, i, RGB(Y, U, V)); 
}//for j 
}//for i 
J 


F| H rgb2yuvO A RSE EER Ж t [усл 
| ЖЗ Эм EDIPDemo T FEF АЈА 2 K 27void 
CDIPDemoView::OnColorRgb2yuv()rH, F ii H 
rgb2yuv( РА 1115 АТ F TZR o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// RGB2YUV 
imgInput.RGB2YUV(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “彩色 图 像 处 理 “RGB2YUV? 来 观察 处 理 效 
果 ， 转 换 后 的 效果 如 图 9.16 所 示 。 





(a) RGB 原 图 (b) 转换 后 YUV 图 〈 以 RGB 的 格式 显示 ) 


49.16 ”RGB 转 YUV 效 果 图 
2. 从 YUV 到 RGB 的 转换 及 其 实现 
R =Y +1.402V 


G =Y -0.344U -0.714V 


B =Y +1.772U 
• MATLAB 实 现 


丁 编 与 了 yuv2rgb0 图 数 ， 实 现 从 yuv 辐 rgb 的 
转换 。 读 者 可 以 在 付 赠 光盘 第 9 章 的 code 目 录 中 找 
到 文件 “rgb2yuv.m”。 相 天 代 人 如 下 。 


function rgb = yuv2rgb(yuv) 

% yuv = rgb2yuv(rgb) 把 一 幅 RGB 图 像 转 的 为 YUV 图 像 ， 

% 输入 图 像 是 一 个 彩色 像素 的 MxNx3 的 数组 ， 

% 其 中 每 一 个 彩色 像 系 部 在 特定 空间 位 置 的 彩色 图 像 中 对 应 红 、 绿 、 
ЗЛЕ. 

% BUA RRG IEEE, АНІ АЙЕ K E X HJ. 

% 输入 图 像 可 能 是 double《〈 取 值 范 围 是 [6，1]) ，uint8 或 uint16 


X 

% 输出 YUV 图 像 古 uint8。 
yuv = im2double(yuv); 
y = yuv(:, :, 1); 

и = yuv(:, :, 2); 

у = yuVv(:, :, 3); 


% 执行 转换 函数 

y + 1.402*v; 

y - 0.344*u - 0.714*v; 
y + 1.772*u; 


O ОО 5 
пи I 


end; 
if(r > 1.0) 


end; 
if(g < 0) 
8 = ©, 
end; 
if(g > 1.0) 
g = 1.0; 
end; 
if(b < 0) 
b = 0; 
end; 
if(b > 1.0) 
р = 1.0; 
епа; 


Г 287455: 
e = 6*255; 
р = b*255; 


rgb = саї(3, г, g, b); 
rgb = uint8(rgb); 
• Visual C++ 实现 


利用 Visual C++ 把 一 幅 YUV 图 像 转 换 为 RGB 图 
像 的 相关 代码 如 下 。 





下 


void CImage: :YUV2RGB(CImage *pTo) 


功能 : 
把 一 幅 YUV 图 像 转换 为 RGB 图 像 


参数 : 
CImage* pTo: 目标 输出 图 像 的 CImage 指针 


返回 值 : 
无 
Е: 
显示 YUV 图 像 时 ， 使 用 RGB 图 像 格 式 在 电脑 上 显示 
ee 
void CImage: :YUV2RGB(CImage *pTo) 
{ 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


int i, J; 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 
// 抽 取 YUV 分 量 

double Y = GetRValue(RGBPixel); 
double U = GetGValue(RGBPixel); 
double V = GetBValue(RGBPixel); 


// 计 算 RGB 

double R,G,B; 

R = Y + 1.402*V; 

G = Y - 0.344*U - 0.714*V; 
B = Y + 1.772*U; 


А E 


if(R > 255) 
К = 255; 
ІҒ(А < Өө) 

К = Ө; 
1f(G > 255) 
G = 255; 

1f(G < 0) 

G = Ө; 
if(B > 255) 
B = 255; 
if(B < Ө) 
В = Ө; 


// 将 分 量 联合 形成 RGB 图 像 
pTo->SetPixel(j, i, RGB(R, G, B)); 


F) H yuv2rgb0 K 27 SE I E KTE А ДЧ с 
WIET EDIPDemo LFE R WJA 2 K уоіа 
CDIPDemoView::OnColorYuv2rgb() 中 ， 其 中 调用 
yuv2rgb() р И Jr Br F PH ZS 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// YUV2RGB 
imgInput .YUV2RGB(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “彩色 网 像 处 理 “YUV2RGB”* 来 观察 处 理 效 
果 ， 转 换 后 的 效果 如 图 9.17 所 示 。 





(a) YUVE) (RGB EZR) (b) 转换 后 RGB 图 


49.17 ”YUV 转 RGB 效果 图 
9.2.6 YIQ 模 型 


YIQ 模 型 是 北美 NTSC 彩 色 制 式 ， 主 要 用 于 美 
的 电视 系统 。 这 种 形式 和 欧洲 的 YUV 模 型 有 相同 
的 优势 : 灰 度 信息 和 彩色 信息 是 分 离 的 。YIQ 模 型 
中 ， 闻 代表 亮度 、T 工 代表 色调 、Q 则 代表 饱和 上 度 。 
其 中 ， 亮 度 表 示 灰 度 ， 而 色调 和 饱和 度 则 存储 彩色 


LI лоо 


1. 从 RGB 到 YIQ 的 转换 及 其 实现 


转换 公式 为 : 











F 0.299 0.587 0.114 R 
f | = | 0.596 —0.274 —0.322 Є 
С) 0.211 —0.523 0.312 В 


上 和 式 中 ， 第 一 行 和 为 1， 下 两 行 和 分 别 为 0。 
• MATLAB 实 现 


MATLABA ŽI rgb2ntscO 可 实现 从 rgb 到 ntsc 的 
转换 ， 其 调用 形式 如 下 。 


yiq = rgb2ntsc(rgb); 


输入 的 RGB 图 像 可 以 是 uint8、uint16 或 double 
类 型 的 O 


输出 图 像 为 M xN x3 的 double 类 型 。 
° Visual C++ 实现 


利用 Visual C++ 把 一 幅 RGB 疼 像 转 为 YIQ 疼 像 
的 相关 代码 如 下 。 





As 
void CImage: :RGB2YIQ(CImage *pTo) 
功能 : ”把 一 幅 RGB 图 像 转 换 为 YIQ 图 像 


参数 : CImage* pTo: 目标 输出 图 像 的 CImage 指针 
BEE: 无 
ey 
void CImage: :RGB2YIQ(CImage *pTo) 
{ 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


int y 2J5 


for(i=0; i<nHeight; i++) 
{ 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 
// 抽 取 RGB 分 量 

double R = GetRValue(RGBPixel); 
double G = GetGValue(RGBPixel); 
double B = GetBValue(RGBPixel); 


// 计 算 YUV 

double Ү,І,0; 

Y = 0.299*R + 0.587*G + 0.114*В; 
I = 0.596*R - 0.274*G - Ө.322*В; 
Q = 0.211*R - 0.523*G + 0.312*B; 


// 防 止 溢出 
if(Y > 255) 
Y = 255; 
if(Y < 0 

Y = O; 
if(I > 255) 

І = 255; 
if(I < Ө) 

I = O; 
if(Q > 255) 


Q = 255; 
if(Q < Ө) 
Q = ð; 


// 将 分 量 联合 形成 YIQ 图 像 
pTo->SetPixel(j, i, RGB(Y, І, Q)); 
}//for j 
}//for i 
J 





利用 rgb2yiqd0 函 数 实现 色彩 模型 转换 的 完整 示 
АБЕ 2ТЕ ТРрето Т." WI AIK K уоіа 
CDIPDemoView::OnColorRgb2yiq0 中 ， 其 中 调用 
rgb2yiqO 孙 数 的 代码 厂 断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// RGB2YIQ 
imgInput.RGB2YIQ(&imgOutput ) ; 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “彩色 图 像 处 理 , RGB2YIQ” 来 观察 处 理 效 
果 ， 转 换 后 的 效果 如 图 9.18 所 示 。 





(a) RGB 原 图 (b) 转换 后 YIQ 图 〈 以 RGB 格式 显示 ) 
图 9.18 RGB 转 YIQ 效 果 图 
2. 从 YIQ 到 RGB 的 转换 及 其 实现 
转换 公式 为 : 
R 
K: 
B 


1.000 —0.272 —0.647 
1.000 = 1.106 1.703 








0.956 0.621 | 


° MATLAB 实 现 


MATLABA ZI ntsc2rgb0O 可 实现 从 ntsc 到 rgb 的 
转换 ， 其 调用 形式 如 下 。 


rgb = ntsc2rgb(yiq); 


其 中 ， 输 入 和 输出 图 像 均 为 double 类 型 。 


• Visual C++ 实现 


利用 Visual C++ 把 一 幅 YIQ 图 像 转 为 RGB 图 像 
的 相关 代码 如 下 。 


On 
void CImage: :YIQ2RGB(CImage *pTo) 
功能 : ”把 一 幅 YIQ 图 像 转换 为 RGB 图 像 
参数 : СІтаве* pTo: 目标 输出 图 像 的 CImage 指针 
返回 值 : 无 
i РРО ИИ 
void CImage: :YIQ2RGB(CImage *рТо) 
l 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 
int i, J; 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


COLORREF RGBPixel = GetPixel(j, i); 
// 抽 取 YIQ 分 量 

double Y = GetRValue(RGBPixel); 
double I = GetGValue(RGBPixel); 
double Q = GetBValue(RGBPixel); 


// 计 算 RGB 

double R,G,B; 

R = Y + 0.956*I + 0.114*Q; 
G = Y - 0.272*I - 0.647*0; 
B = Y - 1.106*І + 1.703*0; 


// 防 目次 出 


if(R > 255) 
R = 255; 
if(R < Ө) 
К = Ө; 
if(G > 255) 
G = 255; 
1f(G < 0) 
G = ð; 
if(B > 255) 
B = 255; 
if(B < Ө) 
В = Ө; 
// 将 分 量 联合 形成 RGB 图 像 
pTo->SetPixel(j, i, RGB(R, G, B)); 
y//for j 
}//for i 
J 


利用 yiq2rgb0O 函 数 实 现 色彩 模型 转换 的 完整 示 
例 航 封 痛 在 DIPDemo 工 程 中 的 视 网 关 函数 void 
CDIPDemoView::OnColorYiq2rgbO0 中 ， 其 中 调用 
yiq2rgb0O 鸭 数 的 代码 户 断 如 下 所 示 。 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// YIQ2RGB 
imgInput .YIQ2RGB(&imgOutput ) ; 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


| 


读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
里 命令 “彩色 图 像 处 理 - YIQ2RGB” 来 观 聚 处 理 效 
果 ， 转 换 后 的 效果 如 图 9.19 所 示 。 





(a) YIQ 图 (b) 转换 后 RGB 图 


49.19 ҮТО ЕСВӘ B 
9.2.7 Lab 模 型 简介 


Lab 模 型 是 由 CIE (国际 照明 委员 会 ) 制定 的 一 
种 彩色 模式 。 这 种 模型 与 说 备 无 天 ， 它 吻 补 了 RGB 
模型 和 CMYK 模 型 必须 依赖 于 设备 颜色 特性 的 不 
E; 此 外 ， 目 然 界 中 任何 色彩 都 可 在 Lab 衬 间 表 达 
出 来 ， 这 就 意味 看 RGB 以 及 CMYK 所 能 接 述 的 磊 色 
信息 在 Lab 中 都 能 得 以 影射 。 


Lab 问 色 空 间 如 图 9.20 所 示 。 其 中 , LARRE 


В; a Е ИК266, ИКЕ: b 的 正 数 
К, ИЕ. 





49.20 Lab 模型 示意 图 


A 一 亮度 为 100( 白 ) ，B 一 深 绿 到 亮 粉 ，C 一 亮 蓝 
э Ж, D-REN С) 


由 于 Lab 模 型 与 设备 无 关 的 特点 ， 使 其 在 彩色 


图 像 检 索 中 应 用 较为 广泛 。 另 外 ， 当 和 希望 在 网 像 的 
处 理 中 保留 尽量 宽 阁 的 色 域 和 丰 遇 的 色彩 时 ， 可 以 

选择 在 Lab 模 型 下 进行 工作 ， 处 理 后 青 根据 输出 的 
着 要 转换 成 RGB 模 型 (显示 用 ) 或 CMYK 模 型 CH 
印 及 印刷 用 ) 。 这 样 做 的 最 大 好 处 是 它 能 够 在 最 终 
T EREE AE 
彩 。 


93 全 彩色 图 像 处 理 基 础 


本 市 要 介绍 全 彩色 图 像 处 理 技术 ， 面 对 各 种 各 
样 的 图 像 处 理 任务 时 怎样 处 理 全 彩色 图 像 。 通 第， 
全 彩色 图 像 处 理 技术 总 的 可 以 分 为 两 大 类 。 


(1) 对 3 个 平面 分 量 单 独处 理 ， 然 后 将 分 别处 
理 过 的 3 个 分 量 合成 彩色 图 像 。 对 每 个 分 量 的 处 理 
技术 可 以 应 用 到 对 灰 度 图 像 处 理 的 扩 术 上 。 但 是 这 
анаи 
Пај 。 


(2) АНХА. Куа, 
图 像 至 少 有 3 个 分 量 ， 彩 色 像 素 实 际 上 是 一 个 癌 
量 。 下 接 处 理 束 是 同时 对 所 有 分 量 进行 无 差别 的 处 
理 。 这 时 彩色 疼 像 的 3 个 分 量 用 回 量 形式 表示 ， 即 
对 彩色 图 像 上 任 一 点 的 像素 c (x ,y )， 有 : 


с(х,у) = 1К(х,у );С (х,у );В (х, у)] 


那么 对 像素 点 (x ,y ) 处 理 的 操作 实际 上 是 同时 
ХЕ, G. B 这 3 个 分 量 操作 。 不 过 通常 大 多 数 图 像 
处 理 技术 者 是 指 对 每 个 分 量 的 单独 处 理 。 接 下 来 将 
о OEE PE 
彩色 平衡 。 


9.3.1 ”彩色 补偿 及 其 MATLAB 实 现 


有 些 图 像 处 理 任务 的 目标 是 根据 闫 色 分 离 出 不 
同 的 类 型 的 物体 。 但 由 于 第 用 的 彩色 成 像 设 备 其 有 
较 觉 且 相 互 窗 访 的 光谱 敏感 区 ， 加 之 行 扣 摄 图像 的 
染色 十 变 化 的 ， 所 以 很 难 在 3 个 分 量 图 中 将 物体 分 
ABR, KAMARIA A HEMNE 
MERA 18) ЛЕЛЕ ЛЕ e A [Н] Н 9:0. 


1. 理论 基础 
彩色 补偿 算法 摘 述 如 下 。 
(1) 在 画面 上 找到 主观 视 党 看 是 纯 红 、 纯 


绿 、 纯 贤 的 3 个 扣 〈 厂 可 根据 便 件 知 过 频段 的 履 雷 
则 无 须 这 样 做 )〉。 


Р, = (RGB) 
Px = (Rs.Gs.B5) 
Р; = (R3,G;,B3) 


(2) 计算 R *、 


之 后 图 像 的 这 度 不 变 ， 则 对 R*、6G 


` e 
e 


它们 的 理想 值 为 : 


P'= (R° 0,0) 
P= (0, G° 0) 
= Р; =(0,0, B`) 


‚ B*E. ыс деш 


*. B*E 


R *= 0.30xR ү + 0.59хС 1 +0.11xB | 


С *= 0.30xR > + 0.59xG > + 0.11xB > 


B *= 0.30xR з + 0.59xG з + 0.11xB > 


СЗ) МЕЗЕ, ЯТ УЗА R ПУВСВ 


EDak тах, МА 


两 个 矩阵 A 1 和 A 5 o 


Fil 

А = | С 
B 

R 

45 = [) 
[ 


(4) ITEE. 


ВАМ НЧ 








(т\т, у) 
В.(т,у) 


| 


5 (т. (| | == 
L 


Арі т. у) 
Е{т,у) = | Сріт, u) 
Вріт. у) 





Л Хут. ІННИ МЕ. 


PIJ (2 у) = C х F (x. и) o 其 中 ‚ C = Ах Аз! о 
2. MATLAB 实 现 


根据 上 述 算 法 编写 的 彩色 补偿 MATLAB 实 现 如 
和 下。 读者 可 以 在 付 赠 光 一 第 9 章 的 code 目 录 中 找到 


文件 “compensate.m”。 


% Compensate .m 
% 彩色 补偿 


im=double(imread('plane.bmp')); 
subplot(1,2,1); 
imshow(uint8(im)); 
title( "原始 图 ' ) ; 
[т,п,р]=5іғе(іт); 
[h1,k1]=min(255-im(:,:,1)+im(:,:,2)+im(:,:,3)); 
[j1,minx]=min(h1); 
i1=k1(j1);% 提 取 图 像 中 最 接近 红色 的 点 ， 其 在 im 中 的 坐标 为 i1,j1 
rl=im(i1,]j1,1); 
gl=im(i1,j1,2); 
b1=im(il,j1,3); 
R=0.30*r1+0.59*g1+0.11*b1; 


[h2,k2]=min(255-im(:,:,2)+im(:,:,1)+im(:,:,3)); 
[j2,minx]=min(h2); 

i2=k2(Jj2);% 提 取 图 像 中 最 接近 绿色 的 点 ， 其 在 im 中 的 坐标 为 i2，J2 
r2=im(i2,j2,1); 

g2=im(i2,j2,2); 


b2=im(i2,j2,3); 
G=0.30*r2+0.59*g2+0.11*b2; 


[h3,k3]=min(255-im(:,:,3)+im(:,:,1)+im(:,:,2)); 
[j3,minx]=min(h3); 

i3=k3(Jj3);% 提 取 图 像 中 最 接近 赣 色 的 点 ， 其 在 im 中 的 坐标 为 13,Jj3 
r3=im(i3,j3,1); 

g3=im(i3,j3,2); 

b3=im(i3,j3,3); 

B=0.30*r3+0.59*g3+0.11*b3; 


A1=[r1 r2 r3 
g1 g2 g3 
b1 b2 b3 | ; 

A2=[R Ө Ө 
осе 
0 © B]; 

C=A1*inv(A2); 


for i=1:m 
for j=1:n 


imR=im(i,j,1); 
imG=im(i,j,2); 
imB=im(i,j,3); 
temp=inv(C)*[imR;imG;imB]; 
S(i,j,1)=temp(1); 
S(i,j,2)=temp(2); 
S(i,j,3)=temp(3); 
end 

end 

S=uint8(S); 

subplot(1,2,2); 

imshow(S); 

title(' 补 偿 后 '); 





采用 上 面 的 程序 对 RGB 图 像 plane.bmp 进 行 彩 色 
ДРЕА, iR u 9.21РТЛК» 





(a) 原始 图 (b) 补偿 后 


图 9.21 彩色 补 傍 效 果 图 


03.2 ”彩色 平衡 及 其 MATLAB 实 现 

一 幅 彩 色 网 像 数 字 化 后 ， 在 显示 时 疝 色 经 常 看 
起 来 有 些 不 正常 。 这 是 彩色 通道 的 不 同 敏感 度 、 增 
光 因 子 和 偏 移 量 等 原因 导致 的 ， 称 其 为 三 基色 不 平 
人 衡 。 将 之 校正 的 过 程 束 是 彩色 平衡 。 
1. 理论 基础 

彩色 平衡 校正 算法 如 下 。 

(1) 从 画面 中 选 出 两 点 颜色 为 灰色 ， 设 为 

F1ı=(R1,G1,B1) 


F2=(R2,G2,B2) 


(2) W P.G нуи, LAER 和 B 分 重 ， 则 


Fi = (RGB) Г. Е =(R GB) 
Б=(0,0,В) 0M Е =(R,0,,B;,) 


(3) Ш = кіх +k2 JR} =k1x R: +2 КНК ТЖК 
2; B{=11x Bı +12 JB; = пх B:+12 3K HH] 1ҖШ1 2 


(4) 用 


RIr.y) = kl x R(z,y) + k2 
В(т,у)* = ll x Bír.w) +12 


G(r.u)* = G(x, у) 
处 理 后 得 到 的 图 像 就 是 彩色 平衡 后 的 图 像 。 
2. MATLAB 实 现 
根据 上 述 算法 编写 的 彩色 平衡 MATLAB 实 现 如 


下 。 旋 者 可 以 在 付 赠 光盘 第 9 章 的 code 目 录 中 找到 
文件 “colorBalance.m>”。 





% colorBalance.m 


% 彩色 平衡 


im=double(imread('plane.bmp')); 
[m,n,p]=size(im); 
Е1=1т(1,1,:); 


F2=im(1,2,:); 

Р1_(1,1,1)=Р1(:,:,2); 

FL (1,1,2)=Е1(:,:,2); 

Р1_(1,1,3)=Р1(:,:,2); 

Р2_(1,1,1)=Р2(:,:,2); 

F2 (1yL;2)SF2C: УЛ): 

Р2_(1,1,3)=Р2(:,:,2); 

К1=(Е1 (1,1,1)-Е2 (1,1,1))/(Е1(1,1,1)-Е2(1,1,1)); 

К2=Е1 (1,1,1)-К1*Е1(1,1,1); 

11=(Р1 (1,1,3)-Е2 (1,1,3))/(Е1(1,1,3)-Е2(1,1,3)); 

12=Е1 (1,1,3)-11*Е1(1,1,3); 

for i=1:m 

for j=1:n 
new(i,J,1)=K1*im(i,j,1)+K2; 
new(i,J,2)=im(i,j,2); 
new(i,j,3)=L1*im(i,j,3)+L2; 
end 

end 

im=uint8(im); 

new=uint8(new); 

subplot(1,2,1); 

imshow(im); 

title( "原始 图 ' ) ; 

subplot(1,2,2); 

imshow(new); 


title( "平衡 后 " ) ; 


采用 上 和 面 的 程序 对 RGB 图 像 plane.bmp 进 行 彩色 
和 平衡， 结束 如 图 9.22 所 示 。 





(a) 原始 图 (b) 平衡 后 


图 9.22 ”彩色 平衡 效果 图 


105 BHAJEE 


现代 计算 机 建立 在 数字 化 的 基础 上 ， 用 离散 的 
数字 表示 模拟 量 时 ， 如 果 要 求 很 高 的 精确 上 度 ， 驳 需 
要 非常 庞大 的 数据 量 。 男 外 ， 由 于 互联 网 的 发 展 ， 
信息 “ 煤 炸 ”的 时 代 已 经 到 来 。 互 联网 一 天 产生 的 信 
上 县 量 需 要 1.68 亿 张 DVD 进 行 存 储 。 图 像 数据 远 比 文 
本 更 占 空间 ，1MB 空 间 可 以 存放 一 部 百 万 字 的 小 
说 ， 却 只 能 存放 大 约 20 张 256x256 大 小 的 灰 度 BMP 
图 片 。 与 存储 空间 相 比 ， 在 信息 的 传输 上 对 数据 压 
缩 提 出 了 更 高 的 要 求 。 一 路 标准 清晰 度 彩 色 电 视 对 
亮度 分 量 Y 和 色 度 分 量 R-Y、B -Y 的 取样 频率 分 别 
为 13.5MHz、6.75MHz、6.75MHz， 每 个 数 采 用 8bit 


(13.5+6.75+6.75) x8=216Mbit/s 
这 么 大 的 数据 量 ， 是 不 可 能 不 经 压缩 百 接 传输 
有 的。 因此， 对 图 像 进 行 压缩 ， 束 成 了 当务之急 。 本 
章 将 介绍 图 像 压 缩 的 基本 原理 ， 并 在 Visual C++ 中 
实现 币 用 的 压缩 编码 技术 。 
本 章 的 知识 和 技术 热点 
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(7) JPEG 和 JPEG2000 压 缩 标 准 
本 章 的 典型 案例 分 析 


RIUJPEG K КЖ НАН +T Я 


10.1 ЖАНТ 


ОЗ Н] PLE aJ ka tE T BRT (t JU 
性 。 其 元 余 性 可 以 从 至 间 、 统 计 和 视 党 等 方面 进行 
阐述 。 香 农 定 理 香 诉 读 着 ， 压 缩 所 能 达到 的 极限 束 
EZEBE А а. ВИАН АКАНИ 
品 比 等 指标 进行 衡量 。 


10.11 л 


BAZE AREA АТЛ. B 
像 可 以 用 多 种 方式 表示 ， 假 如 采用 方法 一 ， 你 存 需 
п FH, ЖАЛ, WA mn И, MIA 
一 相对 于 方法 二 的 元 余 可 以 表示 为 : 


l 
Pse e 
u CR 


(10-1) 


其 中 ，CR 为 方法 一 对 于 方法 二 的 压缩 率 ， 可 
以 表示 为 : 


(10-2) 


耕 m=10m2， 则 说 明 ， 表 示 同 样 的 信息 ， 方 法 一 
需要 相当 于 方法 二 10 倍 的 空间 ， 其 元 余 度 为 : 


І! 
Яр = 1 Ti 00° 
(10-3) 


ТЕТИК КАЯН Y BERINAI IBIHJ ЛЖ 
性 : 像 系 几 余 、 统 计 风 余 和 视觉 几 余 。 


1. &ЛЖ 


АИ НЕНУЕ. ИП, ERES 
КЕЈН, ЛИАНИ Ју а КЪН БЕТ Үү 
Ё. РКИ, AUDITE — хе zu, E| РУЗ #H 
Н] ИЛ AJP E pk e И Pe Же ДЕУИ Ж, 
EURAKAZ, КАА Л ЕЩ, M 
只 能 表现 为 无 意义 的 图 像 ， 如 电视 接收 故障 时 出 现 


的 雪 化 点 。 


像 取 几 余 可 以 分 为 空域 的 见 余 和 时 则 上 的 元 
余 。 对 于 大 部 分 图 像 而 言 ， 当 前 像素 与 其 左 方 或 上 
方 的 相 邻 像 双 有 很 强 的 相关 性 。 图 10.1 为 某 测试 图 
价 ， 图 10.2 为 其 灰 肛 直方 图 。 


т = 
[Fa 11 
i ' 


` Ы 
| ш 





110.1 原始 图 像 
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Ж ОЛЕНУ ЭШИ») , PH4925 Л B k JE 
直方 图 如 图 10.3 和 图 10.4 所 示 。 





ÉJ10J33 ЖН JE 


了 相 减 图 像 灰 度 直 方 图 


0 50 100 150 200 250 


4104 KEAN KI 


HHE10.2FF 28, ДАКИ ж л 2k IB AE0—255 
之 团 ， 需 要 8bit 编 码 。 而 多 10.4 所 示 的 直方 图 时 
示 ， 相 减 之 后 的 图 像 中 大 部 分 像 际 在 0 一 50 之 间 ， 
其 中 像素 值 在 0 一 32 之 间 的 像素 占 所 有 像素 的 
96%, 11810-16 |8] Н 2 192%. 0168] 
R RIER п НДЫ п Em. АХ, ANT 
АЈ ЕҤ ВЛАЕ Е, ХАКА T ARERIA Y 
Е, á S нр НЕК о 


在 视频 中 ， 一 般 每 秒 需要 播放 24 张 以 上 的 入 
像 ， 人 眼 才 能 形成 连续 的 视觉。 而 1/24s 之 内 图 像 的 
变化 一 般 虱 比较 做 小 ， 因 而 表现 为 时 间 上 的 相关 
性。 如 图 10.5 所 示 为 一 个 视频 序列 第 0 帧 和 第 3 帧 的 
图 像 ， 除 了 前 景 中 人 的 手 恬 和 船 染 的 运动 以 外 ， 背 
景 几乎 没有 太 大 变化 。 





图 10.5 ”视频 序列 


以 上 所 述 即 为 像 系 几 余 ， 一 般 在 编码 中 灯 用 预 
测 的 方式 消除 空 顽 和 时 间 域 上 的 像 隶 元 余 。 


2. 统计 几 余 


统计 元 余 是 最 根本 的 元 余 ， 对 于 任何 数据 都 适 
用 。 文 件 压缩 软件 WinRAR、WinZip、gzip 等 均 针 
对 统计 克 余 设计 压缩 算法 ， 以 缩小 数据 的 存储 空 
上 站。 统计 克 余 基于 以 下 规律 : 在 大 部 分 数据 文件 


中 ， 不 同 的 符号 出 现 的 概率 并 不 相同 。 


以 图 像 为 例 ， 设 想 一 下 ， 对 于 一 幅 灰 度 图 像 ， 
原始 图 像 相 当 于 对 0 一 255 每 个 像素 值 均 采用 8bit 编 
僻 。 如 果 讼 图 像 中 ， 灰 度 什 为 0 一 79 的 像 际 的 各 右 
571%, 110-7981 36 i MAAR 480%, 
ПОЛИН 7802558103 H20%, ШЕШН 
EPDE, ХН 140-791 Н 7bit2m 
码 ， 而 对 出 现 概 率 低 的 80 一 255 像 素 采 用 9bit 编 码 ， 
则 共 需 比特 数 为 : 


N x 0.86 x 7 + N x 0.2 x 9 = TAN 


而 原始 图 像 所 需 比 特 数 显然 为 ， 这 种 方法 只 需 
要 原始 图 像 的 7.4/8=92.5% 空 间 即 可 。 这 事实 上 就 是 
一 种 变 长 编码 ， 其 核心 原理 是 ， 用 短 的 码 字 编码 那 
些 出 现 概率 大 的 字 节 ， 用 长 的 码 字 编码 那些 出 现 概 
率 小 的 字 和 有 有， 从 而 降低 了 平均 但 长 。 


这 一 所 可 以 用 生活 经 验 进 行 解释 。 人 尔 Windows 
操作 系统 用 尸 安 寂 了 很 多 软件 ， 他 布 望 每 次 局 动 一 
个 程序 或 应 用 时 需要 单 击 也 标 的 识 数 最 少 。 那 么 他 
一 定 会 将 最 各 用 的 程序 设 症 成 果 面 快捷 方式 或 者 将 
其 放置 到 快速 局 动 栏 中 ， 这 样 束 可 以 通过 1 钦 孔 标 
单 击 来 局 动议 程序 。 而 对 于 不 名 用 的 软件 则 将 其 放 
在 开始 末 蛙 中， 需要 使 用 的 时 候 才 打开 开始 末 单 ， 
JP EJ н 50), X т 22232 АКУ ЕТЕ Pe 


作 。 对 于 极 不 钊 用 的 软件 ， 考 碟 到 后 用 使 盘 空 间 等 
问题 ， 甚 至 会 在 需要 用 的 时 候 再 重新 安装 ， 用 完 之 
后 翻 载 ， 这 一 般 需 要 5 次 以 上 的 限 标 单 击 。 总 而 言 
之 ， 局 动 越 钊 用 的 软件 ， 化 费 的 代价 应 访 越 小 ， 这 
样 才 能 使 平均 趴 标点 击 钦 数 达 到 最 小 。 


3. йл, 


Ж ЖУА ААЛ ШО ЛЖАН, БЛ 
[х ЕТ ЕТЕ ЖАН RA, 2030 aW 8 
Р 0148 ЖЇР ИЙ Ás i] Ti lJ 22 ЕН ZE 55 ПП 22 А, 
HJ, JO2682 F А ыр S ЖЕЕ ХЕЙ, 
ЖАШ хз РЈ ы Хә ПП ЖКА E 
Н ЖАА, ТЕЛ ШИН] 5 уйи. НТА 
Але пт), XARA Т ЭРЛАН Ж 


(1) 细节 分 辨 率 。 在 观察 图 像 中 的 大 块 面 积 
时 ， 人 有 眼 才 需要 分 辨 出 全 部 256 个 灰 度 等 级 ， 对 于 
小 块 面积 和 精细 细节 ， 由 于 视觉 的 掩盖 效应 ， 人 有 眼 
无 法 区 分 细致 的 灰 度 差别 ， 因 为 不 需要 那么 多 灰 度 
量化 等 级 。 对 此 ， 往 往 对 图 像 进行 频 域 变换 ， 频 域 
中 的 高 频 系 数 表示 图 像 细 节 ， 在 量化 时 ， 对 高 频 系 
数 采 用 更 大 的 量化 值 。 


(2) 运动 分 辨认 。 对 于 标清 电视 来 说 ， 只 有 
在 观察 静止 图 像 时 才 需 要 40 万 以 上 的 像素 ， 物 体 快 


速 运动 时 ， 只 需 采 用 较 少 的 灰 度 等 级 。 


(3) 彩色 分 辨 率 。 人 有 眼 视觉 特性 的 研究 表 

明 ， 人 有 眼 对 黑白 图 像 的 细节 有 较 高 的 分 辨 力 ， 而 对 
彩色 图 像 的 细节 分 辨 力 较 低 ， 即 “彩色 细节 失明 ”。 
在 彩色 图 像 的 表示 中 ， 只 有 大 面积 部 分 需要 在 保留 
其 亮度 信息 的 同时 还 必须 保留 其 色 度 成 分 。 闫 色 的 
细节 部 分 可 以 用 亮度 信号 来 取代 ， 色 上 度 只 需 大 致 描 
述 整 个 区 域 的 颜色 即 可 。 这 就 是 大 面积 着 色 原 理 。 
在 量化 时 ， 色 度 的 量化 系数 比 亮度 的 量化 系数 更 
大 ， 且 在 电视 的 4:2:0 系 统 或 YUV 图 像 格 式 中 ， 每 4 
个 亮度 像素 点 对 应 一 个 色 度 像素 点 ， 大 大 减少 了 用 
于 编码 色 皮 分 量 的 比特 数 。 


10.1.2 香农 定理 


既然 统计 九 余 可 以 米 用 变 长 编码 的 方式 消除 ， 
那么 古人 寿 可 以 无 限 降低 数据 所 占 的 空间 呢 ? 管 案 走 
售 定 的 。 受 然 不 可 能 用 一 个 字 和 来 表示 一 部 电影 。 
数据 大 小 的 核心 在 于 信息 量 ， 任 何 压缩 手段 〈 无 损 
Жн) 部 不 可 能 使 压缩 结果 小 于 原 数 据 的 信 矢量 
小 ， 这 束 古 香农 党 一 定理 一 一 无 损 编 公 理论 。 


首先 介绍 信息 量 的 概念 ， 对 于 随机 事件 : ， 候 
如 其 发 生 的 概率 为 Pb) ， 则 其 包含 的 信息 量 为 : 


IiE) = log —— = – ов (P (£ )) 





(10-4) 


м, УТРО =1 НТ, AEN, BU; 
确定 性 时 间 不 包含 任何 信息 量 。 反 过 来 ， 如 果 友 生 
概率 小 的 事件 居然 肥 生 了 ， 则 包含 了 己 大 的 信息 
量 。“ 霖 和 炸 性 新 闻 ” 一 般 吏 是 这 种 情况 。 


将 一 幅 图 像 看 作 一 个 具有 随机 输出 的 信 源 ， 它 
从 符号 集 0 一 255 中 产生 符号 序 列 。 议 信 源 符号 集 为 
B= fo ， 每 个 符号 产生 的 概率 分 别 为 Pm) ， 故 单个 
人 符号 的 目 信 息 为 5o= -log(P(b)) ， 信 源 输 出 的 平均 信 
娠 可 以 用 下 式 求 得 : 


П 
FE (B) = zy P (bi) x log (F {b;)) 
> 


(10-5) 


АЕ не 
时 包含 的 平均 信息 量 的 大 小 。 当 各 个 符号 出 现 的 概 
жерн, DEREK. 


对 于 符号 ， 其 自信 息 为 (ы) = –10(Р(6)), [ДШ 
АН Клу: 的 公子 对 其 进行 编码 ，L(w) 满足 : 


ГБ) < Libi) it; ТБ) + 1 
(10-6) 


КОЕШ Z МА, ATEI Г 2 
МЕБ. д = ы Б Т Ltota ЇЙ ДЕ. : 


lim al 
no ; 





| = E(B) 
(10-7) 
BFI KA Жа FERR. ЖЕЙ ЛАС В 
— EH, ASSEM, P РД КЫЛЫШ ла 
Е ВЈ, HA Zh ЫН J. ЕХ mh 29 22 75J: 


(10-8) 


”也 n7 值 在 0~~1 之 间 ， 越 接近 1， 表 未 编码 效率 越 
Bpo nD, RIRIA ERR o 
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眼 判 新 ， 客 观 质量 一 般 采 用 信息 噪声 比 〈Signal- 
Noise-Rate, SNR) 进行 衡量 。 


有 损 压 缩 得 到 的 图 像 与 原 图 像 已 及 生 内 容 上 的 
ш 对 于 wxx KAWEA, КИЙНН тк 


M М 


em) =)> 7 (2,5) — f (жй) 
(10-9) 


Í (x ‚у ) 为 原始 ЕИ, о УШ ЖА E Н) | 
Be ОО КН КАА, ПЕ АЕ 548 
素 计算 平均 值 才能 反映 图 像 的 差异 。 一 般 使 用 均 广 
误 弄 作为 评价 指标 : 


„ч 1/2 
M N 2 


Е 02 F (æy) — f(z)| 
(10-10) 
E па НУ y Мт Е Н ЖААН ЧИНУ A 


均 方 误 雪 相 比 ， 将 比值 作为 衡量 标准 。 定 义 信 品 比 
SNR: 


M N, L 
| а) | 
SNR = 10 х lo s 
M N | | u -2 
x f (T Y} — f(T, y)| | 
1 一 们 


7=0 


(10-11) 


或 者 使 用 峰值 信 骂 比 (Peak-Signal-Noise- 
Rate ° PSNR) ° 


пу Ае 255? 
PSNR = 10 х log | ——  — ——— 
M N | 2 
ASA f жүл == Y Umi y)| / MN) 
=0 1—0) 


. . 


(10-12) 


如 果 两 幅 图 像 完 全 相同 ， 上 式 分 母 为 零 ， 失 去 
意义 。 此 时 可 定义 PSNR 值 为 一 个 较 大 的 整数 ， 如 
100. 一般 情况 下 ，PSNR 值 在 30 以 上 即 可 使 人 眼 难 
т УКА... 


10.2 DCT 变换 与 量化 


本 节 主 要 介绍 JPEG 标 准 中 使 用 的 DCT 变 换 及 
其 之 后 的 量化 步骤 ， 并 给 出 了 一 种 实现 。 


10.2.1 DCT 变换 原理 


ARM и Н 52 #| е КЖЕ [Н] БИН =, 
(B15 = ИЛЛЕ НУ о 58 NES. ЖЕЙ 
Е H S BLR ik apa LA КЛО. 


e K-L (Karhunen-Loeve Transform) > X ÆR 
ЕА КНоіеШпел f., ТЕА) 
Е) КА ЫН] ЕЕЛЕЗ®, ВЕЕ = ТЕЛУ 
换 域 的 相关 性 全 部 解除 。 

离散 傅 里 时 变换 (Discrete Fourier Transform, 
ЕТ). А п И ВУ, ЗЕТ 
化 或 平滑 操作 ， 在 本 书 第 6 章 已 有 介绍 。 但 傅 里 
叶 慨 换 存 在 一 个 问题 ， 即 其 变换 结果 为 复数 ， 
对 此 存储 的 数据 量 相当 于 原来 的 两 倍 。 

头 尔 什 -哈达 到 变换 (Walsh-Hadmard 
Transform, WHT) 。 征 一 种 典型 的 非 正 弱 函 数 
FR, КНЕ АНЬ ИЕЫ, HAS 
R ERRARTE, Eita 
AMRI (Discrete Cosine Transform, 
DCT) „ EH m ЖД) Ж5Е5Ж, НІКА 
HFEA Pg, RARAN BEA F, T 
泛 用 于 图 像 压缩 。 

МАР (Wavelet Transform, WT) 。 具 有 多 
分 辨 率 分 析 的 特点 ， 文 持 渭 进 传输 。 


КИНЕ йил ЕЛЕЙ, 但 计算 过 于 复 
杂 ， 需 要 对 符 压 缩 的 每 一 张 图 像 分 别 求 解 变 换 基 。 
实际 应 用 中 往往 退 而 求 其 < 次， 选择 一 种 性 和 E 好 、 计 
算 量 可 以 接受 的 变换 方法 。 典 型 的 方法 就 是 DCT 变 
换 ， 在 JEG 标 准 中 也 及 用 DCT 伙 换 进 行 压 缩 。 


DCT 变 换 的 基本 思路 是 将 图 像 分 解 为 8x8 的 子 
块 或 16x16 的 子 块 ， 并 对 每 一 个 子 块 进行 蛙 独 的 
DCT 变 换 ， ДЫн АЛТА? 吉 果 进行 量化 、 编 码 。 随 着 
子 志 尺寸 的 增加 ， 算 法 的 复杂 度 和 急剧 上 升 ， 因 此 ， 
实用 中 通常 采用 8x8 的 子 块 进行 变换 ， 但 玉 用 较 大 
的 子 块 可 以 明显 减少 图 像 分 块 效 应 。 

MxN 和 矩阵 的 二 维 DCT 变 换 的 公式 为 : 


(21 十 К ару 1) up 
F (u,v) = С (u) C (u) (E, J) —— 
VMN AI AN 








(10-13) 


(10-14) 


РСТ м 42 Ej 1E% 27H [E] : 


‚Оо, 2 _, у, у, 121+ 1) ыр (27 + 1) ър 
Fia J) = ——— С (м) Civ) E (u, Е HM 
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u= =й 
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其 中 ，i=o1 M-1, j=0,1…,N-1, H. 





C(u),C(v)=: 4/2 
Ё 其 他 


(10-16) 


DCT 变 换 后 ， 低 频 系 数 集中 在 窍 阵 左 上 角 ， 其 
5 сЕ (0,0) 代 表 了 图 像 像 系 的 直流 分 量 ， 
称 为 DC 系数 ， 其 余 元 系 代 表 了 了 交流 分 量 ， 称 为 AC 
系数 。 对 于 图 像 而 言 ， 低 频 分 量 能 量 较 大 ， 融 频 分 
量 能 量 相 对 较 小 。 测 试图 像 与 其 DCT 弯 换 绪 末 如 图 
10.6 所 示 ， 可 见 ， 变 换 后 右 下 角 部 分 大 部 分 元 素 接 
近 零 ， 呈 现 暗 区 。 











DRE (b) DCT 变 换 


410.6 IMARA AN HDCT fh 
DCT 变 换 是 可 逆 的 ， 经 过 反 变 换 ， 理 论 上 可 铺 
ВАА НЕ. 18 HTF Е Е [АЈ й, п 


能 产生 舍 入 误差 。 因 此 ， 在 很 多 场合 采用 了 经 过 改 
进 的 DCT 整 数 变 换 ， 这 样 有 以 下 两 个 好 处 。 


(1) 采用 整数 运算 ， 不 会 有 舍 入 误 弄 的 问 


(а) yW 


> O 


(2) 整数 运算 的 代价 比 乘法 要 小 得 多 ， 可 以 
通过 整数 加 减 和 移 位 操作 完成 变换 ， 有 利于 提高 计 
算 效率 。 


在 H.264 视 频 编码 中 ， 即 采用 了 4x4 数 DCT 变 
换 。 在 实现 时 ， 先 对 每 行 做 一 维 变 换 ， 再 对 每 一 列 


做 一 维 变换 ， 为 减少 运算 量 ， 每 一 步 还 可 以 采用 蝶 
形 算法 。DCT 整 数 变 换 与 尿 DCT 变 换 的 结果 有 做 小 
到 和 寞 ， 但 由 此 引入 的 压缩 效 对 下 降 得 做 乎 其 做 ， 计 
TIR SE AN f AK WEDE mi o 


10.2.2 量化 


DIJPEGJE EERE УУГ  1@ ЖАН F Т] = ЇЇ, 
操作 。N x 的 像素 块 经 过 DCT 变 换 后 依然 为 N 
xN 的 块 ， 变 换 本 喘 无 明显 压缩 作用 。DCT 变 换 必 
须 与 量化 配合 使 用 才能 得 到 较 好 的 压缩 效果 。 可 以 
说 ， 图 像 压 缩 的 有 损 压 缩 的 部 分 主要 来 目 于 量化 。 
量化 过 程 就 是 将 每 一 个 DCT 系 数 除 以 一 个 固定 常 
数 ， 再 四 舍 五 入 取 最 接近 的 整数 。 由 于 DCT 变 换 已 
经 将 能 量 集 中 在 块 的 左上 角 ， 很 多 高 频 系 数 非 常 
小 ， 经 过 量化 后 变 为 零 ， 而 剩 下 的 系数 也 很 大 程 虔 
上 缩小 了 动态 范围 ， 减 少 了 编码 所 需 的 比特 数 。 

考虑 到 人 眼 对 灰 度 信号 比 色 度 信 号 更 敏感 ， 量 
化 时 设计 了 两 份 人 不同 的 量化 表 ， 如 表 10.1 和 表 10.2 
所 示 。 
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量化 的 特点 可 以 概括 为 以 下 两 点 。 


。 对 低频 分 量 采用 细 量 化 ， 对 高 频 分 量 采用 粗 量 
化 ， 相 当 于 低 通 滤波 器 。 
。 对 灰 度 采用 细 量 化 ， 对 色 度 采用 粗 量化 。 


以 下 为 8x8 的 灰 度 和 矩阵 A 。 


156 159 15% 155 158 156 159 158 
160 154 157 158 157 159 158 158% 
156 159 159 1559 158 1560 159 158 
160 154 157 15% 157 159 15% 15% 
156 153 1559 159 159 155 156 155 
159 15959 1559 157 156 159 152 158 
156 159 157 156 1535 155 154 155 
159 159 156 159 156 159 lar 161 


对 A ТЕРСТ® H. ж/а, S |B=Q(DCT(A 
) ) Q ()) 为 量化 。 


l4 ü — 0 0 00 Ü 
—- 0 Ü п о 0 0 0 
Ü Ü Ü O о ооо 
U о 0 п о ооо 
0 о 0 O о ооо 
паа —1 —1 0 Ü Ü 
Ü Ü Ü O 0 ооо 
Ü Ü Ü п 0 0 0 Ü 


在 B 中 只 包含 5 个 非 零 元 素 。 


10.2.3 ”DCT 变换 和 量化 的 Visual C++ 实现 


在 Visual C++ 中 实现 了 DCT 变 换 和 量化 操作 太 
其 对 应 的 他 操作 。DCT 人 变换 和 有 反 变 换 的 核心 尔 数 如 
下 所 示 ， 了 函数 dct8x8x 和 idct8x8x 用 于 对 8x8double 型 
数组 进行 变换 ， 相 天 代码 如 下 。 


pS Sut ЕЕЕ 


void CImgProcess::dct8x8(double *in, double *out) 
功能 : 执行 8x8DCT 变 换 

参数 : 

double *in: ”输入 的 8x8 double 一 维 数组 指针 

double *out: 输出 的 8x8 double 一 维 数组 指针 

15 ВИЕ: 

A 


i i 


void CImgProcess::dct8x8(double *in, double *out) 
{ 


int T; 


// ЛМ 002128, JRW Е 7у-128127 
for (1=0; 1<8; 1++) 


for (j=0; j<8; j++) 
{ 


in[i*8+j] -= 128; 
J 


for (i=0; i<8; i++) 
for (j=0; j<8; j++) 
{ 


double s=80; 


int m,n; 
for (m=0; m<8; m++) 
for (n=0; n<8; n++) 
s += in[m*8+n] * cos( (2*m+1)*PI*i/16 ) * co 
s( (2*n+1)*PI*j/16 ); 


out[i*8+j] = s/4; 


if (i==0) 
out[i*8+j] = out[i*8+j]/sqrt(2.0); 
if (j==0) 


out[i*8+j] = out[i*8+j]/sqrt(2.0); 


} 


ik u O; S ЕЕ S КЕЕ KOS Sos 


void CImgProcess::idct8x8(double *in, double *out) 
功能 : Ju4T8x8DCT)M FA 

参数 : 

double *in: ”输入 的 8x8 double 一 维 数组 指针 

double *out: 输出 的 8x8 double 一 维 数组 指针 

15 НИЕ: 

无 


¿S S о оа Ki t G 
void CImgProcess::idct8x8(double *in, double *out) 
{ 
int i,J; 
for (i=0; i<8; i++) 
{ 
for (j=0; j<8; j++) 


double s=0; 
int m,n; 
for (m=0; m<8; m++) 


l 


for (n=0; n<8; n++) 


double f = in[m*8+n] * cos( (2*i+1)*PI*m/16 
) * cos( (2*j+1)*PI*n/16 ); 
if (m==0) 
f = f/sqrt(2.0); 
if (n==0) 
f = f/sqrt(2.0); 


S += f; 


) 


J 
out[i*8+j] = s/4; 
J 
J 


// 每 个 像素 加 上 128， 将 动态 范围 调整 为 6 至 255 
for (i=0; i<8; i++) 
{ 

for (j=0; j<8; j++) 


out[i*8+j] += 128; 


} 
} 


量化 和 反 量 化 的 核心 函数 编码 如 下 。 





аа 


void CImgProcess::quant(double *іп, int *out) 

功能 : 执行 量化 操作 ， 输 入 的 8x8 一 维 double 数 组 ， 量 化 后 输出 8x8 
一 维 int 数 组 

参数 : 


double *in: 输入 的 8x8 double 一 维 数组 指针 
int *out: 输出 的 8x8 int 一 维 数组 指针 
返回 值 : 

无 
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void CImgProcess::quant(double *in, int *out) 
{ 
int 1,7; 
for (i=0; i<8; i++) 
l 
for (j=0; j<8; j++) 


double f = in[i*8+j] /double(Quant table[i][j]); 


// 取 整 操作 ， 很 关键 ， 处 理 不 当 会 引入 失真 
if (in[i*8+j]>=0) 
out[i*8+j] = int(floor(f+0.5)); 
else 
out[i*8+j] = int(ceil(f-0.5)); 
if (out[i*8+j]<-128) 
out[i*8+j]=-128; 
if (out[i*8+j]>127) 
out[i*8+j]=127; 
J 
J 
J 
站 
void CImgProcess::iquant(int *in, double *out) 
功能 : 执行 反 量化 操作 ， 输 入 的 8x8 一 维 int 数 组 ， 反 量化 后 输出 8x8 
一 维 double 数 组 
参数 : 
int *in: 输入 的 8x8 int 一 维 数 组 指针 
double *out: 输出 的 8x8 double 一 维 数 组 指针 
返回 值 : 
无 


人 


void CImgProcess::iquant(int *in, double *out) 
{ 
int 1,7; 
for (i=0; i<8; i++) 
for (j=0; j<8; j++) 
out[i*8+j] = in[i*8+j] * double(Quant table[i][jJ 


]); 
} 





其 中 用 到 了 灰 度 量化 表 Quant_table[8][8]， 在 文 
件 开 头 定 义 ， 编 码 如 下 。 


// DCT 量 化 数组 

int Quant table[8][8]= 

{ 
16,11,10,16, 24,40, 51,61, 
12,12,14,19, 26,58,60, 55, 
14,13,16, 24,40, 57,69,56, 
14,17,22, 29,51,87,80,62, 


18,22,37,56,68,109,103,77, 
24,35,55,64,81,104,113,92, 
49,64,78,87,103,121,120,101, 
72,92,95,98,112,100,103,99 





Д ЕРрСТУ RM EM р Н ЕР8х889:, DA F 
РА ЖОАН [| Бра, XPE ahir aria Ba 
尺寸 必须 是 8 的 整数 倍 ) ， 再 依次 进行 变换 和 量 
| 
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void CImgProcess::DCT All(CImgProcess *pTo) 

功能 : 对 当前 图 像 计 算 DCT 变 换 和 量化 ， 再 将 结果 存 入 pTo 指 针 中 
参数 : 

CImgProcess *рТо: 计算 结果 保存 至 pTo 中 

JZ НИЕ: 

无 


(Opa k ЕЕЕ ЕЕЕ ЕБИ 


void CImgProcess::DCT All(CImgProcess *pTo) 
l 
int wn=m pBMIH->biWidth/8; 
int hn=m pBMIH->biHeight/8; 
int i,J,m,n; 
for (i=0; i<hn; i++) 
{ 
for (j=0; j<wn; j++) 
{ 
// 用 GetGray 取 出 元 素 ， 转 为 double 数 组 
double din[64|, dout[64]; 
int іоиї[64 |; 
for (m=0; m<8; m++) 


l 
for (n=0; n<8; п++) 
l 
din[m*8+n] = double(GetGray(j*8+n, i*8+m)); 
} 
} 


// 对 每 个 块 做 变换 和 量化 
dct8x8(din, dout); 
quant(dout, iout); 


// 调用 SetPixel， 将 结果 写 入 到 pTo 中 
for (m=0; m<8; m++) 


{ 


for (n=0; n<8; n++) 
l 
unsigned char t=(unsigned char)(iout[m*8+n]+ 
50); 
pTo->SetPixel(j*8+n, і*8+т, RGB(t,t,t)); 


下 


void CImgProcess: :1IDCT А11(СІтеРгосеѕ5ѕ *pTo) 

功能 : 对 当前 图 像 计算 反 量 化 和 DCT 反 ， 再 将 结果 存 入 pTo 指 针 中 
参数 : 

CImgProcess *рТо: 计算 结果 保存 至 pTo 中 

JZ НИЕ: 

无 
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void CImgProcess::iDCT_All(CImgProcess *pTo) 
{ 
int wn=m pBMIH->biWidth/8; 
int hn=m pBMIH->biHeight/8; 
int i,J,m,n; 
for (i=0; i<hn; i++) 
l 
for (j=0; j<wn; j++) 
{ 


// 用 GetGray 取 出 元 素 ， 转 为 double 数 组 
double dout1[64], dout2[64]; 

int iin[64]; 

for (m=0; m<8; m++) 


l 


for (n=0; n<8; n++) 
iin[m*8+n] = double(GetGray(j*8+n, i*8+m))-5 


) 
} 


// 对 每 个 块 做 反 量化 和 反 变 换 
iquant(iin, dout1); 
idct8x8(dout1, dout2); 


// 调用 SetPixel， 将 结果 写 入 到 pTo 中 


for (m=0; m<8; m++) 


for (n=0; n<8; n++) 
l 
double d=(dout2[m*8+n]); 
if(d<0) 
d=0.0; 
if(d>254.5) 
0=254.0; 
unsigned char t=(unsigned сһаг) (іп) (а+0.5); 
pTo->SetPixel(j*8+n, і*8+т, RGB(t,t,t)); 


利用 DCT_A10O 可 实现 图 像 的 DCT 变 换 和 量 
化 。DCT 变 换 和 量化 的 完整 示例 被 封装 在 DIPDemo 
工程 中 的 视图 类 孙 数 void 


CDIPDemoView::OnDct10 中 ， 其 中 调用 DCT_All () 
РЁ ЖИ НУГМАН ТИП F EZR o 


CImgProcess imgInput = pDoc->m Image; 


// 检 奉 图 像 羡 灰 度 图 
if (imgInput.m pBMIH->biBitCount!=8) 


AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 


return; 


J 

// ЛЕА УВА 22 48 

if (imgInput.m pBMIH->biWidth%8!=0 || imgInput.m pBMI 
H->biHeight%8!=0) 


AfxMessageBox( " RZ w m х8, EIRE! "); 
return; 

J 

CImgProcess imgOutput = imgInput; 

// 

imgInput.DCT All(&imgOutput); 

pDoc->m_ Image = imgOutput; 





利用 iDCT_A10 可 实现 反 量化 和 DCT 肥 变换 。 
反 量 化 和 DCT 反 杰 换 的 完整 示例 被 封 痛 在 DIPDemo 
Т НУ 2 р 5 уоіа 
CDIPDemoView::OnDct20 中 ， 其 中 调用 iDCT_Al 0 
РКУ АА F ETR o 


CImgProcess imgInput = pDoc->m Image; 


// 检 奉 图 像 羡 灰 度 图 
if (imgInput.m pBMIH->biBitCount!=8) 


AfxMessageBox(" 不 是 8-bpp 灰 度 图 像 ， 无 法 处 理 ! "); 
return; 


} 
// EM R УВ Н (77 
if (imgInput.m pBMIH->biWidth%8!=0 || imgInput.m pBMI 
H->biHeight%8!=0) 
{ 
AfxMessageBox(" B3 w = 18И, ЛА"); 
return; 


J 

CImgProcess imgOutput = imgInput; 
// 

imgInput.iDCT All(&imgOutput); 


旋 者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 束 
单 命令 “图 像 压 缩 -DCT 变换 + 量化 ?来 进行 变换 与 
量化 操作 ， 再 通过 这 音 命令 “多 像 压缩 ~ 反 量 化 
+DCT 逆 变换 ”复原 图 像 。 依 次 执行 这 两 个 命令 ， 测 
试 结 果 如 图 10.7 所 示 。 


在 图 10.7 (а) 中 ， 由 于 经 过 了 量化 ， 一 个 8x8 
块 中 的 非 零 系数 比较 稀少 ， 而 且 量 化 后 系数 的 动态 
їй. ЛЛУ, [ПЛА ЛУИ ЖУНЛЕ, (IRH 
它 可 以 得 到 还 原 图 像 〈 如 图 10.7 (b) 所 示 〉， 还 原 
ZR- SR RREA h PH i WALDE ER 





(а) DCT+ 量 化 的 结果 (Б) 反 量化 :DCT 反 变换 的 结果 


图 10.7 测试 结果 
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КИЕ BU inj (Pulse Code Modulation, 
РСМ) И у ar НУЛЕ. EL HIPCM 
fiw B rinsi K. PH a K. Ану h 
(Differential Pulse Code Modulation, DPCM) 来 对 
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WE ДЫЙ, ЖЕРЕ РЕЙ вак) КЖ 4 

FTS НИЕ Н дЕ F =N: 
ор > E (b;) > E (b;|b; :> Eb ра) > Ем 
(10-17) 

MAE 91 个 符号 之 击 的 符号 已 知 的 情况 下 进 
行 预测 ， 不 确定 性 有 可 能 减 小 ， 除 非 符号 之 间 完 全 
AMHR. BWN SHREK, EE 
Е. 

DPCM 系 统 的 编码 器 和 解码 器 如 图 10.8 所 示 ， 
除了 预测 编码 外 ， 还 加 入 了 量化 环节 。 


预测 编码 器 输出 的 是 实际 值 * 与 信号 预测 值 ; 
之 间 的 差 值 。; 


(10-18) 


ЕЭ е, е; 
预测 天 
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7 © 预测 需 
接收 端 
预测 需 


410.8 ” ”DPCM 原理 框图 


ТЕЙ im ЕН EREET 与 上 一 个 信 源 符号 什 
之 和 : 


(10-19) 
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到 解码 问 的 值 是 真实 值 经 过 大 分 编 翁 、 量 化 后 的 
值 。 因 此 只 有 使 用 公式 淳 ei 计算 预测 值 才能 保证 
个 引入 更 多 的 误差 。 


以 上 所 述 的 例子 只 是 简单 地 用 前 一 个 符号 预测 
后 一 个 符号 的 操作 过 程 。 实 际 采用 的 预测 系统 可 能 


ENER, АЕА), 2%ТЕНУ 7 
HPJ P БАЕ 2%: 


(10-20) 
HHE, s ЛУЖА. 


如 果 在 计算 时 ， 当 前 实际 值 与 预测 的 样本 值 之 
旧 的 计算 关系 是 非 线 性 的 ， 则 称 为 非 线 性 预测 。 此 
外 ， 除 了 将 信 源 符号 作为 一 维 的 信号 序列 外 ， 还 可 
以 进行 二 维 预 测 ， 如 视频 编码 标准 H.264 中 ， 使 用 
当前 4x4 块 的 左 方 和 和 上方 像 系 形成 了 预测 块 进行 帆 内 
预测 ， 如 图 10.9 所 示 。 





图 10.9”H.264 帧 内 预测 
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(F10.1.1/ I ЕЛЯ УА íf паю 
(Variable Length Coding, VLC) 的 概念 ， 并 用 打 
开 软 件 所 珊 的 鼠标 单 击 次 数 为 例 进行 了 介绍 。 稚 夫 
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TE R T hH ИЖЕ R == UE NSEJ AY i Zn ЛУ ç 
霍 夫 受 树 是 市 权 路 径 长 度 最 小 的 二 又 树 ， 即 最 优 二 
Ж» QR АНТЕ Е ЖНГ fO Е, Ж 
REWER. ЇЙ KH WR А = РАЛЫ H ДАН 
Юу, APA ЛЫ, Ж ЖЛ S 1 л 
较 远 ， 对 应 的 人 码 字 较 长 。 
1. ER Em R 


(1) 霍 夫 曼 编码 的 第 一 步 是 统计 各 信 源 符号 
的 出 现 概率 。 假 设 图 像 采 用 8 级 灰 度 ， 各 级 灰 度 值 
出 现 的 次 数 如 表 10.3 所 示 ， 


表 10.3 像素 概率 表 


出 现 次 数 出 现 概率 
12370 0.19 
13108 0.20 


14514 0.22 


w 
` 








(2) МЕЕ КЕ. maX AAEE IT HAF 
J, HET НА А hI AANT а НО УААН 
JH, ТЕУ VH КАН М R. ААА ТИК 
这 两 个 和 点 ， 在 新 的 概率 表 中 重新 寻找 概率 了 最 小 的 
两 个 闻 点 ， 如 此 循环 操作 。8 个 市 点 需要 进行 7 次 操 


作 ， 了 最 终 得 到 根 和 节点 。 根 币 点 的 概率 值 必 为 1， 如 
表 10.4 所 示 。 

第 一 轮 概率 值 最 小 的 是 0.03 与 0.02， 将 两 者 合 
并 ， 得 到 其 父 节 点 0.05， 并 将 两 者 概率 大 的 那个 


( 即 0.03) 编码 为 1L， 概 率 小 的 那个 〈( 即 0.02〉 编码 
为 0。 这 是 第 一 次 循环 。 


第 二 次 循环 ， 找 到 概率 最 小 的 两 个 下 点 为 0.05 
和 0.06， 将 两 者 合并 ， 得 到 父 节 点 0.11， 并 将 两 者 
概率 大 的 那个 〈 即 0.06) 编码 为 1， 概 率 小 的 那个 
( 即 0.05) WENE. RRIA, wA RRAN 
系 0.42 与 0.58， 将 两 者 合并 ， 得 到 根 季 点， 并 将 两 
者 之 中 概率 大 的 那个 节点 (0.58) 编码 为 1， 概 率 小 
的 那个 节点 《0.42) WENE., P, ERSA 


EHE. 


表 10.4 EEREN 


0.22 0.22 0.22 0.22 


3 0.22 (1 )—— 2 042 (0)———nnq 
l 0.20 0.20 0.20 0.20 0.20 (0) 

0 0.19 0.19 0.19 0.19 (1) — — 0.34 034 (1)— 0.58 (1) 

4 0.15 0.15 0.15 0.15 (0) 

7 0.13 0.13 0.13 (1) —— 0.24 0.24 024 (0) 

6 0.06 0.06 (1)—0.11 (0) 

2 0.03 (1)—0.05 (0) 

5 0.02 (0) 


(3) 对 图 像 进 行 编码 。 对 于 图 像 中 出 现 的 像 
际 ， 及 用 如 表 10.4 所 示 的 编码 方式 进行 编码 。 从 根 
PRETRES, WKI MOLBE, Ba 
相应 符号 的 编码 。 例 如 ， 对 于 灰 度 值 为 6 的 像素 ， 
依次 经 过 “1” “0”, “0”, “1”， 最 终 到 达 根 节点 ， 
地 友之 后 ， 得 到 编码 模式 为 1001; 灰 上 度 介 为 5 的 像 
素 ， 依 次 经 过 “0”、“0”、“0”、“0”、“1”， 将 其 相 
连 ， 逆 序 之 后 ， 得 到 编码 模式 为 10000。 各 人 符 亏 的 
编码 模式 和 码 长 如 表 10.5 所 示 。 


210.5 н 





|] ||, [ер 
Ju 
5 111 10001 01 110 10000 1001 101 
_ 3 2 5 2 3 5 4 3 





根据 各 符号 的 概率 值 和 相应 的 码 长 ， 可 计算 编 
伺 的 平均 但 长 如 下 : 


Liota /n = 3 x 0.19 + 2 x 0.2 + 5 x 0.03 + 2 x 0.22 + 3 x 0.15 + 5 x 0.02 + 4 x 0.06 + 3 x 0.13 
= 2.74 


显然 ， 如 果 采 用 普通 的 编码 方式 ，8 个 灰 度 级 
需 采 用 3bit 进 行 编码 ， 因 此 该 压缩 算法 的 压缩 率 为 
2.74/3=91.33%。 

е ВЕ К, АРАА Н) ДИ: 

E (B) = —{0.19 x log 0.19 + 0.2 x log 0.2 + 0.03 x log 0.03 + 0.22 х log 0.22+ 
0.15 х log 0.15 + 0.02 х log 0.02 + 0.06 x log 0.06 + 0.13 х log 0.13) 
= 2.7016 


2.7016 
1 


根据 定义 ， 该 压缩 算法 编码 效率 为 ar 0 
; Rini 的 编码 方法 的 编码 效率 为 -3 = 90057 
， 编 码 效率 越 接近 1， 表 示 压 缩 效率 越 好 ， 霍 夫 曼 
压缩 算法 的 编码 效率 明显 优 于 原始 非 编码 算法 。 
2， 霍 夫 曼 解 码 


М Је, ЕНЕ АЛКАНИ, WI 


Ж Жз Бу CEKA EARTE, KEER 
АВЕ жє Ж SW ПИЖ ЕЧ ER = Zt Е 
I, АИМА АУ) ое 9) Ч НН. 
ДАМЕ ЈУ ААР АЕРА, ВИ Ат ЫЕ 
у ЈЕ ЖЕЙ, А k St kth ВЈ 
ПУТИ, Е НИЕ НАТЕ, 
ЫШ] лз Ао Е, ER EREA Н чя 
每 个 码 字 长 度 的 情况 即 可 做 到 无 歧义 解码 。 


以 如 表 10.5 所 示 的 编码 模式 为 例 ， 对 于 编码 
串 “001000101101111”， 首 先 按 顺 序 遍 历 霍 夫 曼 
树 ， 遇 到 “00”， 对 应 像素 1， 故 解码 得 1， 待 解码 的 
编码 串 变 为 “1000101101111”。 再 次 遍历 霍 夫 曼 
树 ， 巡 到 “10001”， 对 应 像 系 2， 故 解码 得 2， 繁 解 
码 的 编码 串 变 为 “01101111”。 继 续 遍 历 ， 依 次 解码 
得 到 3、7、0， 因 此 编码 串 “001000101101111” 的 解 
人 码 结果 为 5 个 像素 值 : 1、2、3、7、0。 


逢 夫 曼 编码 每 次 进行 编码 都 要 先 统计 待 压 颖 数 
Ў НО ЖЕТИП, ЖЕ K АЈ. WREE 82 Ta 5° 
Ви eE, Ea LERAREN, $I 
80289 Н НУ ЖЕЙ H. LFA ИШ КЕЛ. 


(1) 下 省 压缩 时 间 。 免 去 了 统计 概率 分 布 和 
重建 堆 夫 曼 树 的 计算 时 间 。 


(2) TEATE. ИЛЭН X =M 
dz Жое Ж ЕЛКЕА, [А] Лу R: ЖЕ ЖАН 
НУЛЕ 2741 н] é g Жу КАН ШУЫ БЕЛЕ S ИЛЫ 
Fo Но Н] РДА Е ЖЕ ЙГ АЫ НОЈ [н], Ж 
Жее Ze ИК ЖАЯА [ 。 


10.4.2 +E X = ZJ Н J Visual C++ 实现 


在 Visual С++ MERS, АРЛ < 
的 任意 文件 进行 编码 ， 并 输出 以 “.huf” 为 后 级 的 压 
JH ZER o 


首先 在 Visual С+ъ+ Е У 2, HTERS 
编码 。 以 下 为 Huffman.h 文 件 的 内 容 。 


// Huffman .h 

// ER Z КУИ 
#ifndef HUFFMAN H_ 
#define HUFFMAN H_ 


#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 


// TE REA 
typedef struct huffNode 


int parent,lchild,rchild; 
unsigned long count; // 字符 出 现 的 次 数 
unsigned char c; // 对 于 的 字符 


char bits[256]; // 编码 串 
上 HuffNode ; 


#define N_Node 512 // 256 个 字符 ， 需 要 511 个 节点 才能 
Ж] БАЛЕ Ж че 


class HuffCode 
l 


public: 
HuffCode():m_fpInfile(NULL), m_fpOutFile(NULL){} 
~HuffCode(){ xInit Tree(); } 


// 设置 输入 文件 指针 
void SetInputFile(FILE *fpInfile) 
l 
m fpInfile = fpInfile; 
J 


// 设置 输出 文件 指针 
void SetOutputFile(FILE *fpOutFile) 


l 

m fpOutFile = fpOutFile; 
J 
// вер 


double GetRawFileEntropy(); 

double GetAverCodeLen(); 

double GetRate(){return double(m nCompressFile)/dou 
ble(m_nRawFile);) 

unsigned int GetRawSize() (return m_nRawFile;) 

unsigned int GetNUsedChar() {return m nUsedChar;} 

unsigned int GetMaxCodeLen() {return m nMaxCodeLen; 


void BuildTree(); // HEEREN 


unsigned int EncodeFile(); // m 


unsigned int DecodeFile(); // АЕ, 
public: 
HuffNode m HTree[N Моде]; // ERT Н 
private: 
FILE *m fpInfile; // 输入 文件 指针 
FILE *m fpOutFile; // 输出 文件 指针 
unsigned int т nRawFile; // 未 压缩 文件 字 节 数 
unsigned int m_nCompressFile; // 压缩 文件 字 节 数 
unsigned int m пуѕеасһаг; // 使 用 到 的 字符 个 数 


unsigned int m пМахСодеіеп; // 最 长 编码 串 的 长 度 


private: 

void xTnit_Tree(); // 初始 化 每 个 节点 
J; 
#endif 


Huffman.h ЖЇР ЕЕ E X / ЈИ 
HuffNode， 堆 夫 曼 编码 类 HuffCode。 以 下 为 实现 文 
件 Huffman.cpp 的 内 容 。 





// Huffman.cpp 
// 霍 夫 曼 编码 实现 文件 


#include “Huffman.h”" 
#include <math.h> 


下 


unsigned int HuffCode::DecodeFile() 


功能 : ”设置 输入 文件 指针 和 输出 文件 指针 后 进行 起 夫人 受 解 但 
参数 : ”无 
RPA: unsigned int， 解 但 得 到 的 原始 文件 字 节 数 


iu ii C K ЕЕЕ ЕТЕ S K t ЛЕЛЕ ЕЛЕК S a s / 


unsigned int HuffCode::DecodeFile() 
l 

XInit Tree(); 

if (NULL == m fpInfile || NULL == m_fpOutFile) 

{ 

return -1; 

J 

fseek(m fpInfile, ©, 2); 

т nCompressFile = ftell(m fpInfile); 

fseek(m fpInfile, Ө, Өө); 

// 读 取 头 信息 : 

// m_nRawFile: 原始 文件 的 长 度 

// m_nuUsedChar: 有 用 的 字符 数 

// m_nMaxCodeLen: 154 

// m НТгее: EREK 

Ғгеаа(&т nRawFile, sizeof(unsigned іп), 1, т fpInfil 
е); 

fread(&m nUsedChar, sizeof(unsigned іп), 1,т fpInfi 
le); 

fread(&m nMaxCodeLen, sizeof(unsigned int),1,m_fpIn 
file); 


unsigned int i; 
for(i=0; i<=m_nUsedChar; i++) 
l 
fread(&m НТгее[1].с, sizeof(unsigned char), 1, т + 
pInfile); 
fread(&m HTree[i].bits, m nMaxCodeLen, 1, m fpInfi 
le); 
J 


// 开始 解压 文件 


unsigned int nOutChar = Ө; 

unsigned char c; // ERI 

char ac_digital[256]; // 读 到 的 字符 转 为 二 进 制 学 和 从 串 
char buffer[256]; // АШ ЖЕЕ 

buffer[0] = 

while(true) 


// 读 取 m_nMaxCodeLen 个 bit 到 buffer 中 
while(strlen(buffer) < м nMaxCodeLen) 
{ 
Ғгеаа(&с,1,1,т ҒрІпҒі1е); 
int К=с; 
_itoa s(k, ас digital, 2); 
k=strlen(ac digital); 
int 1; 
for(1=8;1>k;1--) // 在 单字 和 内 对 相应 位 置 补 6 
{ 
strcat(buffer,"0"); 


strcat(buffer,ac digital); 


J 
// buffer 与 码 表 中 的 值 比较 
unsigned int i; 
for(i=0; і<=т nUsedChar; i++) 
l 
if( memcmp(m HTree[i].bits, buffer, strlen(m HTr 
ee[i].bits)) == 0) 
l 


break ; 


} 


} 
strcpy(buffer, buffer+strlen(m_HTree[i].bits)); 


c = m НТгее[ії]|.с; 
fwrite(&c, 1, 1, m fpOutFile); 
m _HTree[i].count++; 


//#uvL É а ЖЇЁҤЛЄЛЕ, Эте ТТЕ Së pk 
nOutChar++; 
if(nOutChar == m nRawFile) 

break; 


) 


return nOutChar; 


} 


a i S t i ОРООН Е 


unsigned int HuffCode::EncodeFile() 
功能 : ”设置 输入 文件 指针 和 输出 文件 指针 后 进行 霍 夫 曼 编码 
参数 : 无 
返回 值 : unsigned int， 压 缩 后 的 文件 的 字 节 数 
0 
unsigned int HuffCode::EncodeFile() 
{ 
if (NULL == m fpInfile || NULL == m fpOutFile) 
l 


return -1; 


// 与 头 信息 : 

// 原文 件 总 长 度 ，4 字 市 

// 用 到 的 字符 个 数 ，4 字 市 

// 最 大 人 码 长 ，4 字 市 

// EX: oK 

Ғѕеек(т fpOutFile,0,0); 

fwrite(&m nRawFile, sizeof(unsigned int), 1, т fpOu 
tFile); 

fwrite(&m nUsedChar, sizeof(unsigned int), 1, m_fpO 
utFile); 

fwrite(&m nMaxCodeLen, sizeof(unsigned int), 1, m f 
pOutFile); 

unsigned int i; 

for(i=0; i<=m_nUsedChar; i++) 


l 


fwrite(&m HTree[i].c, sizeof(unsigned char), 1, m_ 
fpOutFile); 
fwrite(&m HTree[i].bits, m пМахСодеіеп, 1, m fpOut 
File); 
J 


// ЖАНЕ 
char buf[N_Node]; // 存放 编码 结果 


int j = 0; // 读 取 位 置 游标 
int c; // 读 取 的 字符 
int k; 


unsigned int п wr = 12+(1+т nMaxCodeLen)*(m nUsedCh 


аг+1); // ® АШ 


buf[90] = '\@'; 
fseek(m_fpInfile, Ө, SEEK_SET); 
while(!feof(m fpInfile)) 
l 

c = fgetc(m_fpInfile); 

j++; 

for(i = 0; i <= m_nUsedChar; i++) 

l 

if(m HTree[i].c == с) 
break; 


J 
strcat(buf, m _HTree[i].bits); 


// 累计 编码 位 数 超过 一 个 字 市 ， 即 对 文件 执行 写 入 
k = strlen(buf); 


c = 0; 
while(k>=8) 
{ 


for(i=0;i<8; i++) 


if(buf[i]=='1') 


c=(c<<1)|1; 
else 
c=c<<1; 
J 
fwrite(&c,1,1,m fpOutFile); 
n _wr++; 
strcpy(buf, buf+8); 
k = strlen(buf); 


J 
if(j == m_nRawFile) 
һгеаК; 
J 
if( юе ) // 可 能 还 有 剩余 字符 
{ 
strcat(buf,"@0000000"); 
for(i=0; i<8; i++) 
{ 
if(buf[i] == '1') 
c = (с<<1) |1; 
else 
с = C<<1; 
J 
fwrite(&c, 1, 1, m fpOutFile); 
n _wr++; 
J 


т nCompressFile = п wr; 
return n wr; 


) 


ЗЕ КЕЛЕЕ БЕ ааа 


void HuffCode: :xInit Tree() 
功能 : ЈАВА рт SA 


参数 : Ж 
5 РИБ: 无 


人 


void HuffCode: :XInit Tree ) 


int 1; 

// -1 表示 没有 父母 或 子女 

for(i=0;i<N Node;i++) 

l 
// 出 现 的 次 数 为 零 
m _HTree[i].count=0; 
// HAS HJ 
m HTree[i].c=(unsigned char)i; 
m HTree[i].lchild=-1; 
m HTree[i].parent=-1; 
m HTree[i].rchild=-1; 


) 


i iu i L K ОРЕВИ КЕЛЕЛЕК ТЕЕ 


double HuffCode: :GetInFileEntropy() 
功能 : ЖАЯ I RE 
参数 : 无 
REE: double, RE C EB SIB 
0 a 
double HuffCode: :GetRawFileEntropy() 
{ 

if (NULL==m fpInfile) 

return -1.0; 
unsigned int i; 
double entropy=0.0; 


for (i=0; i<=m_nUsedChar; i++) 


{ 
if (т HTree[i].count != Ө) 


double rate = 1.0*m HTree[i].count/(double)m_nRa 
wFile; 


entropy += rate*log(double(rate))/log(2.0); 


) 
} 


return -entropy; 


} 


ee ed YY 


double HuffCode: :GetAverCodeLen() 
功能 : ”计算 编码 的 平均 人 码 长 
参数 : ”无 
返回 值 : double， 编 码 的 平均 码 长 
下 
double HuffCode: :GetAverCodeLen() 
{ 

if (NULL==m fpInfile) 

return -1.0; 

unsigned int i; 

double len=0.0; 

int s=0; 

for (i=0; i<=m nUsedChar; i++) 


if (m HTree[i].count != Ө) 


len+=strlen(m HTree[i].bits)*m HTree[i].count; 
s+=m_HTree[i].count; 
J 
J 


return 1еп*1.0/<;; 


) 


站 


void HuffCode: :BuildTree() 

功能 : ”根据 m_fpInfile 指 定 的 文件 ， 旋 取 文 件 内 容 ， 构 建 堆 夫 受 树 
参数 : Ж 

返回 值 : 无 


和 
void HuffCode: :BuildTree() 


int i,j,k; 


// 工 .初始 化 树 


XInit Tree( ) ; 


// 2. 统 计 得 入 文件 中 各 个 字符 出 现 次 数 
m _nRawFile = ө; 

unsigned char c; 

while(!feof(m fpInfile)) 


fread(&c,1,1,m fpInfile); 
m НТгее [с ]|.соипё++; 
m nRawFile++; 

} 

m nRawFile--; 

m _HTree[c].count--; 


// 3.count 为 8 的 不 要 ， 按 count 从 大 到 小 排列 
HuffNode temp; 
for(i=0;i<255;i++) 
l 
for(j=i+1;j<256;j++) 


if(m HTree[i].count<m HTree[j].count) 


temp=m НТгее[і |; 
т НТгее[і |=т HTree[ j]; 
т НТгее [5 |=+етмр; 
J 
J 
J 


// 4. 统 计 有 用 字符 数 
for(i=0;i<256;i++) 
if(m_HTree[i].count==0) 
һгеаК; 
m _nUsedChar = 1-1; 


// Б.М E 2 =e bt 
unsigned int min_count; // count 的 最 小 值 


int т=2*1-1; // 整 棵 树 共 有 m MHA 
int min index; // 最 小 count 值 节点 的 序号 
for(i=m_nUsedChar+1; i<m; 1++) 

{ 


min count=UINT МАХ; 
for(j=0;j<i;j++) 
l 
// А УЛП КАШГ APSR hcount tE, +£ Ж H л JII 
中 过 


if(m_HTree[j].parent!=-1) 
continue; 
if(min_count > m HTree[j].count) 
{ 
min Index=]; 
min count=m НТгее[ тіп іпаех |. соип+; 


} 
} 
// pt 是 i 的 左 孩 子 


m HTree[i].count=min_ count; 
т НТгее[ тіп іпаех |.рагепё=і; 
m НТгее[і |.1сһі1а=тіп index; 


тіп count=UINT МАХ; 
for(j=0;j<i;j++) 


// GW 2 ТА y4kaecscountíñ, AAKE КАЙ 
УКУ 
if(m HTree[j].parent!=-1) 


continue; 
if(min count>m HTree[j].count) 
{ 
min Index=]; 
min count=m НТгее[ тіп іпаех |. соип+; 


} 
} 
// pt 是 i 的 右 孩 子 


m НТгее[і |.соипЕ += min _ count ; 
т НТгее[ тіп _index].parent=i; 
т HTree[i].rchild=min index; 


} 
// 6. 为 每 个 有 权 值 的 字符 编码 


for(i=0; i<=m nUsedChar; i++) 
{ 
Ке; 
m HTreeļi].bits[0]=0; 
// = А19) ЕЕ, PARTANE, WURKEN л НАНУ 
写 ， 形 成 编码 字 从 串 ， 如 “8611@” 
while(m HTree[k]j.parent != -1) 
{ 
j=k; 
k=m_HTree[k].parent; 
// SWE RELI ARETA 
// 编码 为 8 
if(m_HTree[k].lchild==j) 


j=strlen(m HTree[i].bits); 
теттоме (т _HTree[i].bits+1,m HTree[i].bits,jJ+1) 


m_HTree[i].bits[|[0]='0'; 
} 
// 当前 节点 是 父 节点 的 右 节点 
// 编码 为 1 


else 


j=strlen(m_HTree[i].bits); 
memmove(m НТгее[1 |.61+5+1, m HTree[i].bits, j+ 


1); 
m _HTree[i].bits[0]='1'; 


// 7. 记 有 录 最 长 的 编码 长 度 
m _nMaxCodeLen=80; 
for(i=0;i<=m_nUsedChar;i++) 


l 
if(m_nMaxCodeLen<strlen(m_HTree[i].bits)) 


m_nMaxCodeLen=strlen(m_HTree[i].bits); 


) 


p. EER == 2SHuffCodeZF ЖЕ Ж = ИШТЕ 
框 中 被 调用 的 代码 ， 在 对 话 框 类 中 维护 一 个 
HuffCode 类 有 的 对 象 。 在 Visual C++ 中 添加 对 话 框 如 
图 10.10 所 示 。 


н 
[Hr 


ЕЕ 

输入 文件 ， 

be а 
输出 文件 ， 


ГТГ 
В 
[Hr[Br: [Br[Hr[Hr 


Б 
平均 码 长 ， 
| Зу ч, 





410.10 ÆR = Zf ЛЕ 
对 话 框 功能 说 明 如 下 。 


(1) 早 击 第 一 个 “ 浏 贤 ” 按 钮 可 以 打开 一 个 文 
件 选 择 对 话 框 ， 选 取 输 入 的 每 编 公 文件 。 


(2) 第 二 个 “浏览 ?按钮 设置 输出 文件 的 路 


СЗ) 选择 好 输入 文件 和 输出 文件 路 径 后 ， 单 
人 DS т Хн, Ж 
ИКАТ ЕЕН» ЕЧЕН НУУН bj ln] ЛУ 
РЁ 5% уоіа CDlgHuffman::OnBnClicked 


ButtonEncodeO 中 ， 使 用 堆 夫 受 编 公关 HuffCode 的 
对 象 ， 并 调用 相应 函数 完成 编码 。 人 代码 请 段 如 下 。 


FILE *iFile, *oFile; 
if ((iFile = fopen (m _inFilePath, "rb")) == NULL) 


AfxMessageBox ("输入 文件 打 不 开 !\n"); 


return; 


} 
if ((oFile = fopen (m OutFilePath, "wb")) == NULL) 


AfxMessageBox ("输出 文件 无 法 创建 1\n"); 


return; 


J 
huffcode.SetInputFile(iFile); 
huffcode.SetOutputFile(oFile); 
huffcode.BuildTree(); 
huffcode.EncodeFile(); 
fclose(iFile); 

fclose(oFile); 





(4) ТМТ, ТЕТЕ À СЕНУ ЛУЈА Pe 
ERI“ hu НЭС, Вала аР т 2 
(ТА. ЕУЕН ДУУА ПА ЛУ РЁ 27void 
CDlgHuffman::OnBnClickedButtonDecodeO0 中 ， 使 用 
HuffCode 对 象 完成 解 个 ， 代 码 卢 段 如 下 。 





FILE *iFile, *oFile; 
if(m_inFilePath.Right(3)!="huf") 
l 


AfxMessageBox ("输入 文件 应 为 (*.huf) 文 件 !\n"); 


return; 
J 
if ((iFile = fopen (m _inFilePath, "rb")) == NULL) 


AfxMessageBox ("输入 文件 打 不 开 !\n"); 


return; 
J 
if ((oFile = fopen (m OutFilePath, "wb")) == NULL) 


AfxMessageBox ("输出 文件 无 法 创建 1\n"); 


return; 


J 
huffcode.SetInputFile(iFile); 
huffcode.SetOutputFile(oFile); 
huffcode.DecodeFile(); 
fclose(iFile); 

fclose(oFile); 


谈 者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 深 
т ЖАЯА > ER = ZJ ПЫ” ЖТТ FER S 
Z. HEIDIT ITE, 328. НАТЕ. EXTER 
W Е Т А. ШШ ЖЛЕ, ВАЕН, 9010445 
果 如 图 10.11 所 示 。 


ГЁТЕ ASCE | 编码 
А УФЕ. 14 01001 


FAman.bmp | йй K ПОН 


00000 
УЕ: 111110 


[Fäman.bmp.hut Г р ВЕРЕ ира 


Гая] ва] ж 


JUIL 
011111 
011110 
011100 
011010 
011000 





图 10.11 编码 结果 


Еп 10.1157 КН, BAE RAAN 
7.05, 23141 57.08, 201029 2799.5%, ЖЯ? 
深 为 94.3%， 输 出 文件 为 man.bmp.huf。 注 意 ， 编 码 
5% 2% УИН Ej Jade Z EE, ПОКА Уу КАН SC 
件 大 小 与 原始 文件 大 小 之 比 。 这 里 的 压缩 文件 已 将 
ЖЕ m ke SE S Ei УЙГУ ТЕ ру. 


Fj éeman.bmp.huf LHE ARA LEIT AE 
但， 结果 如 图 10.12 所 示 。 


ГЕЧЕ 编码 
АУФ: 14 = mom 


| ЕЕГ: | Š 13 00011 
FAman.bmp.huf йй q 00000 
АУЕ. 1? 111110 


Fimalbm ° BJ % ска АЕ: Ыш ВЕРЕ ира 


ав || 解码 | xm 


011111 
011110 
011100 
011010 
011000 

Ш 





410.12 ”解码 结 


10.5 974814 


起 天 受 纺 但 虽 然 梓 称 为 最 优 编 介 ， 但 也 存在 一 
些 问 题 。 例 如 ， 其 编码 的 人 码 字 长 度 必 为 整数 位 。 这 
是 很 显然 的 ， 对 于 一 个 出 现 概率 为 s()=13 的 符号 5 
， 其 信息 量 为 


一 log [p (b;)] = 1.59 


因此 ， 要 达到 最 高 的 编码 效率 ， 应 为 其 分 配 长 
度 为 1.59 的 公 字 ， 这 显然 不 可 实现 。 同 梓 ， 对 于 概 


率 为 »() -2/3 的 符号 ， 其 信息 量 为 0.59， 但 编码 时 至 
少 要 为 其 分 配 一 个 比特 的 码 字 。 这 样 就 使 得 进一步 
提高 压缩 效率 变 得 非常 困难 . 


20 世 纪 60 年 代 ，Elias 提 出 了 算术 编码 的 概念 ， 
但 没有 公布 其 发 现 。1976 年 ，R. Pasco 和 J. Rissanen 
分 别 用 定 长 的 寄存 亏 实 现 了 有 限 精 上 度 的 算术 编 伍 。 
1979 年 Rissanen 和 G. G. Langdon 一 起 将 算术 编码 系 
统 化 ， 并 于 1981 年 实现 了 二 进 制 编码 ， 从 此 算术 编 
Е АЕН, НА Кав АИР. 


10.5.1 算术 编码 原理 
1. 算术 编码 原理 


МАн ЯН 了 与 电 夫 受 编 但 截然 不 同 的 中 
R, EHDE RARR EAMT S AENEA 
TEAL. A, Jab: r IK 
AE RERUM H o 


首 乞 给 出 一 个 前 财 后 开 区 间 [iow ,high )， 用 于 
SYL MEWT А зс Ја, Н 
BI у PK A 124 < ü], ВБК. ЕВУ 
Жї A F, 12118] 0,1. METSA, P< 1822 
Е 每 次 减 小 的 程度 与 狐 输 入 的 从 号 的 先 验 概 


° +Z y WJ 65826 X, ИХ |н} ЛУУ ЕЛЕ 
BUD, ЖЇР, Жл ЙТ КАТ i НА ERFDE 
М. 

° FAIT НУСУ ЗЕ ДЕЛУ, ИХ (АЈА НУРЕ 
RKR, МЕ, Жл КАТ WJ yr 132 
Te 

ХИ, ЕЕС S EIE, 
因此 表示 该 区 间 所 需 的 比特 位 被 最 大 程度 地 缩短 

Jo RZ, AR ESARTE, AFLI 

Ж, ADAE n AAE 0, MAKE SRA 9 


Ar ГЛ 


| 
算术 编码 步骤 如 下 。 


(1) 定义 区 间 长 度 range =high -low - high 和 
low 2321771 1А] E КИ. Faa 的 区 间 上 下 限 为 H (a 
)、 工 (a )。 起 始 区 间 为 [0,1)。 


(2) Ла Н, 3 FASENT high, low 和 


range : 
high = low + range х H (а) 
(10-21) 


low = low + тапдє х L (а) 


(10-22) 
range = high — low 


(10-23) 


АХАЛ, Б МТО, Ја 
的 区 间 [ low ,high ) 表 示 为 二 进 制 序列 即 可 。 чүт” 
Ч ан и, ЕХ [Н] AES Ju] ВИ зс ЁЁ 
B, АХ 1А] Т A A EIT REN o 


(1) AWEK, MEF TEW Cay В, 
答 出 该 区 则 范围 对 应 的 从 号 a 。 


(2) 从 编码 数值 f 中 消 际 已 解 公 从 号 的 影 啊 。 
根据 a AKTE FRH (a) L(a), Wf 的 
值 。 





重复 以 上 两 个 步 又， 直到 整个 符 亏 流 解 码 完 


2 
His 


算术 编 但 举例 


以 一 个 实例 来 说 明 算 术 编 码 的 过 程 。 表 10.6 给 
出 了 4 个 信 源 符号 及 其 出 现 的 先 验 概率 。 按 其 概率 
大 小 ， 将 [0, 了 划分 为 4 段 ， 每 段 长 度 与 概 圣 成 正 
К. 


2210.6 FKK 


分 配 区 间 


Л 5 aasa ”， 步 又 如 下 。 





(1) 初始 化 high =1, low =0, range =1. 


(2) 输入 第 Ма , |н (а) =1 ， Llaa)= 0.6 
‚ DL 


high = low + range x Н (aa) = 0+1х1 = 1 
low = low + тапдє х L (аа) = Ü + 1 x 0.6 = 0.6 


range = high — low = 1 — 0.6 = 0.4 


ни ТЛВ аз, AAE (аз) =06 ， 
L lay) = 0.3 , ПД 


high = low + range x H (аз) = 0.6 + 0.4 x 0.6 = 0.84 
[ош = {ош + range х L (аз) = 0.6 + 0.4 x 0.3 = 0.72 


range = high — low = 0.84 — 0.72 = 0.12 


(4) 和 输入 第 ВЗА 04 5 K| JH (aa) =1, 
L(a) =06, IA 


high = low + range x H (ал) = 0.72 + 0.12 x 1 = 0.84 
low = low + range x L (ад) = 0.72 + 0.12 x 0.6 = 0.792 


range = high — low = 0.84 — 0.792 = 0.048 


и 输入 第 个 符号 , 因为 Н (аз) = 
(а) =01, WW 


high = low + range х Н (as) = 0.792 + 0.048 х 0.3 = 0.8064 
[ош = low + range х І (аз) = 0.792 + 0.048 х 0.1 = 0.7969 


range = high — low = 0.8064 — 0.7968 = 0.0096 


(6) 输入 第 5 个 符号 a ， 因 为 Ba) =0.6, 
Llaa)=03 , IA 


high = low + range x H (аз) = 0.7968 + 0.0096 x 0.6 = 0.8026 


[ош = low + range x L (аз) = 0.7968 + 0.0096 x 0.3 = 0.7997 


range = high — low = 0.8026 — 0.7997 = 0.0029 


最 终 得 到 区 间 [0.7997,0.8026)， 该 区 间 中 任意 
一 个 数字 均 可 用 来 表示 码 流 。 这 里 取 区 间 下 限 
0.7997。 多 10.13 清 晰 地 给 出 了 编 僻 过程 。 





图 10.13 ”编码 过 程 


解码 时 ， 根 据 编 码 数 值 0.7997 和 概率 表 СП, 
10.6) 152819475 o 


(1) Ж, f=0.7997/ ŒI 0.6,1)X [н], ЖУ 
得 到 第 一 个 符号 ， 即 [0.6,1) 区 间 对 应 的 a4 ， 再 更 
新 三 : 
_ (fo kia) (0.7997 — 0.6) _ жай 
Hila-Ltea) 1-06 Т 
(2) 0.4992 在 区 间 [ 0.3,0.6) 内 ， 输 出 对 应 的 从 
=a 3 ， Жр: 
(Р — Lial) (0.4992 — 0.3) 


J = И {а= йд} 0.6 — 0.3 


(3) 0.6640 在 区 间 [ 0.6,1) 内 ， 解 码 得 到 a À; 
Р: 


[了 一 三 (ah (0.6640 — 0.6) Ке 
е — = ——— = Ü.16 
Н (а) – Lla] 1 — 0.6 





f 


(4) 0.16 在 区 间 [ 0.1,0.3 ) 内 ， 解 码 得 到 a，， 
ТЕ: 


(f — L (a)) 10.16 — 0.1) 
r У L A _ | I 16 к. _@з 
| Н (а) = Lial 0.3 — 0.1 


(5) 0.3 在 区 间 [0.3,0.6) 内 ， 解 码 得 到 a>。 ， 更 








ЭТ: 


U — Р (а)) (0.3 — 0.3) 0 
= Н(а) = (а) 06-03 ` 


最 终 EARNE, EIE, BHE, mhi 
=“адазада»әаз”& 


Д ЕА и Ah J АШ» ААН 
ЖУПА, НВС УА НБ Р. 


(1) 自 适 应 算术 编码 。 根 据 信 源 符号 的 输 
№, JIRE EK o 


(2) 采用 上 下 文 技术 。 如 对 于 二 进 制 算 术 编 


Í 








1, ЖАНУ МКЧ RA Y “0”. “1 的 出 现 概 
率 ， 而 基于 上 下 文 的 算术 编 公 还 要 考 

谋 “00”、“01”、“10”、“11” 的 出 现 概 次， 可 以 达到 
E m HIE HE o 


10.5.2 FARBA Visual C++ 实现 


paqa A F NAAS, ЛӘ ау 
ЖЕТИ PL йн Т Bill Pr К о ZJ] o u, 2% 
В ERRERA ж, БЫШАТ S 
只 包 舍 “0? 或 “1”。 由 于 任意 符号 最 后 均 可 用 二 进 制 
符号 未 示 ， 因 此 对 本 得 法 稍 加 扩展 ， 即 可 用 来 压 绽 
包括 图 像 和 其 他 文件 在 内 的 任意 数据 。 


算术 编 介 中 和 从 写 的 概 深 可 事先 给 出 。 这 里 可 以 
事先 设 定 概 染 值 ， 也 可 以 由 程序 目 动 计算 输入 厅 列 
中 “0 的 出 现 频 诗作 为 概率 但 。 对 话 框 弄 面 如 图 
10.14 上 所 示 。 


“КЕТТЕТ 


输入 长 度 小 于 16 的 二 进 制 序列 ， 如 “00110" 


示例 编辑 杠 | 


"0" 的 概率 :示例 编辑 
编码 结果 : 
示例 编辑 框 


解码 结果 : 
示例 编辑 框 





410.14 ”算术 编码 对 话 框 
“0" 的 概率 可 由 用 户 输入 一 个 0 一 1 之 间 的 浮 点 
数 给 出 ， 若 输入 一 个 负 值 《 如 -1.0) ， 表 示 由 程序 
目 动 统计 概率 。 


编 僻 和 解 合 的 核心 函数 代码 如 下 。 





下 


void CDlgArith::arith Encode(const char *in, int n, dou 
ble p, char *out, int &outN) 

功能 : 输入 长 为 n 的 二 进 制 序列 in， 输 出 编码 结果 out，out 长 度 为 ou 
tN 。 


参数 : 
const char *in: 输入 61 友 列 如 “661166116” 


int n: J) А0127 УН) < J: 
double p: 6 的 先 验 概率 


char *out: 输出 的 编码 结果 ， 也 是 二 进 制 序列 
int &outN: 输出 结果 的 长 度 
jx eE : 
26 
uu ОВОР ЕЕ РРР И 
void CDlgArith::arith_Encode(const char *іп, int п, dou 
ble р, char *out, int &outN) 
{ 

if(in==NULL || n<=0) 

return ; 


double low=0.0; 
double high=1.0; 
double range=high-low; 
double low 0=0.0, high 6=p; 
double low 1=р, high 1=1.0; 
double fp=1.0; 
int 1; 
for (i=0; i<n; i++) 
l 

if(in[i]=='0') 

l 


high=low + range * high_80; 
low=low + range * low ð; 
range = high - low; 
fp *= (high Ө - low_0); 
yelse 
l 
high=low + range * high 1; 
low=low + range * low 1; 
range = high - low; 
fp *= (high 1 - low_1); 


printf("low: %f\n", low); 


J 
outN = floor(-log10(fp)/log10(2.0))+1; 
for(i=0; i<outN; i++) 


double dpi=pow(0.5, i+1); 
if (low >= dpi) 


{ 
out[i] = '1'; 
low -= dpi; 
J 
else 
{ 
ои [1 ]='0"; 
} 
} 
// 处 理 余数 ,进位 
if (low>0) 


{ 


for(i=outN-1; i>=0; i--) 


if(out[i]=='1') 


out[i]='0'; 
yelse 
{ 
ои [1 |='1'; 
ргеак; 
J 


} 
} 
} 


站 


void CDlgArith::arith Decode(const char *en, 


int n_en, 


double p, char *de, int n_de) 
功能 : W ЛА п епу ЕЛ ]еп, {ШТ KH feu ае, ае 
J Уп ае. 


参数 : 

const char *en: 输入 61 序 列 如 “868611661162?” 
int n_en: 输入 61 序列 的 长 度 

double p: 9 的 先 验 概 率 

char *de: 输出 的 解码 结果 ， 也 是 二 进 制 序列 
int п ае: 输出 结果 的 长 在 

返回 值 : 

无 


ТАРТИ КЕ ЕТЕ БЕСЕ ТЕТУ 


void CDlgArith::arith_Decode(const char *en, int п еп, 
double p, char *de, int n_de) 
{ 
if(en==NULL || n_en<=0 || n_de<=0) 
return ; 


double low 0=0.0, high 6=p; 
double low 1=р, high 1=1.0; 


// ЗЕЯ SAN 
double +=0.0; 
int i; 
for(i=0; i<n_en; i++) 
{ 
double Ярі=ром(@.5, і+1); 
if (еп[1|]=='1') 
{ 
f += арі; 
J 
J 


// АЕЦ 
for (i=0; і<п de; i++) 


l 


if(f<p) // 输出 6 
{ 


йе[1]='0'; 

f = (f-low 0)/(high 0-low 0); 
yelse 
{ 

de[i]='1'; 

f = (f-low 1)/(high 1-low 1); 





arith_Encode() А ZUTE “215” ЈИ У РЁ 25 
void CDIgArith::OnBnClickedButEncode()rF 4% iB 
H, ABAF EU F. 


char *in=(LPSTR)(LPCTSTR)m_ sInput; 
int n=strlen(in); 
int 1; 
if(m p>6 && т p<1) 
р=т_р; 
else 
{ p=0.0; 
for (i=0; i<n; i++) 


if (іп[1]!='0' && in[i]!='1') 


AfxMessageBox(" 只 能 输入 6 或 1 组 成 的 串 !"); 
return; 


J 
if(in[i]=='0') 
D++; 


} 
р/=п; 


J 

char out|512 | ; 

int OutN ; 

arith Encode(in, n, p, out, outN); 
out[outN]='N@0'; 





arith_Decode() “10° BV llin] БУ РК 25 
void CDlgArith::OnBnClickedButDecode() 中 被 调 
H, МЕЛЕК. 


char *еп= (_РЅТК) (_РСТЅТА )т sEncode ; 
int п en=strlen(en); 
if(n_en==0) 


AfxMessageBox(" 先 编码 再 解码 ! "); 


return; 


int п de=m sInput.GetLength(); 

char ае[512 |; 

arith ресоде(еп, п еп, р, de, п ае); 
де [п ае |= '\6'; 





WA HJ ЕДО УК ЕЛЕЮІРОето HJ 2 
ИАА АКАИ Кн АУ И 
ЛЕ, НЛ АЛ 
列 “011011101101111101110101” 时 ， 运 行 效果 如 图 
10.15 所 示 。 其 中 “0 的 出 现 频率 为 25%。 对 话 框 中 


的 输入 概率 “-1”， 表 示 自 动 统计 “0” 的 概率 。 


1 410.155775, 412 7)87.5%. ЖЖ 
ЛЕ ЛЕ, ЖЯ о FEE, TP S k 4 4и 
的 效果 ， 如 采用 概率 为 0.4 和 0.1 时 的 压缩 效率 分 别 
为 91.7% 和 108.3%， 如 图 10.16 所 示 。 


ЕВЫ Ка Иш л. 


输入 长 度 小 于 1B 的 二 进 制 序列 ， 如 D011 


011011101101111101110101 | 
"UP Ж: 1 | р | 


ил СЕА: 87. 50000096) : 


1001011001111010000100 


ЖЕТОН. 


1011011101101111101110101 
жй] | 





410.15 Ял Ж 


ЕТЕР Е | наежи 
ЗР ТБ РЕЈ, H00 Wi Е FF ТАУ ЕВ], Sunil 
|01101 1101101111101110101 011011101101111101110101 


"THEE: |0.4 и | "ое: [0.1 RRS | 
ОЕША L L ERE 91 BBBBB 733 ; ЖЕЛШЕР FEE 108.333939% : 


101001 11000010101111111 | 00000101011101011011101100 


а Я: та. 
|O11D111D110111110111D1D1 01101110110111 1101110101 


Aal 





410.16 “采用 不 同 概率 进行 编码 


10.6 2814 


洲 程 编码 (Run Length Coding, RLC) 是 一 种 
№) В. ДУ 280 (237 444015) DIE. TEK Ji 
是 ， 将 具有 有 相同 数值 的 、 连 续 出 现 的 信 源 从 了 号 
Нен НУК. 

如 “ZzxXXXXyyyyyzzz 4110 7“274х5уЗ2” - 


这 样 束 存在 一 个 问题 ， 假 如 图 像 中 相 邻 的 像 系 
均 个 相等 ， 那 么 诉 程 编 公 非但 起 不 到 压缩 作用 ， 还 
会 因为 需要 传输 像 系 的 出 现 次 数 ， 而 使 数据 量 增 加 
一 借 。 因 此 ， 下 接 对 图 像 进行 编 但 时 ， 游 程 编 但 只 
适用 于 有 较 多 灰 度 相同 的 图 像 ， 也 束 古 说 图 像 最 好 
вхт ЈР х. 


具体 使 用 时 ， 游 程 编 码 往 往 用 于 压缩 二 值 图 
像 、 比 特 平 面 编码 ， 或 与 其 他 压缩 方法 相 结合 。 如 
JPEG 压 缩 在 对 量化 后 的 DCT 系 数 进 行 Z 形 扫描 后 ， 
往往 会 有 多 个 零 的 存在 ， 此 时 应 用 游程 编码 ， 可 以 
有 效 降低 平均 码 长 。 由 于 游程 编码 原理 并 不 复杂 ， 
计算 效率 局 ， 因 此 并 不 影响 编码 速度 。PCX 格 式 的 
图 像 和 Windows 早 期 的 BMP 图 像 使 用 游程 编码 进行 
压缩 。 


JPEG F, ЯГ [Ж 102748х875 90, ШАБ 
ВУРОСТАР R. АА RKA 528х8%Е Е, ЖЛЕ 
FAEH RAOT EMEF, 11743311, H 
Л ЈНА Еа, Хал жж Je, 1410.77 
示 。 


表 10.7 н Е 


0 0 0 0 0 0 -1 0 





如 表 10.7 所 示 的 8x8 定 孟 中 ， 只 有 5 个 非 零 元 
际 。 各 直接 保存 该 是 阵 ， 需 要 8x8=64 字 节 。 采 用 游 
程 编码 形成 码 字 : 


14,1,-1,2,-1,32,-1,8,-1,ЕОВ 


EOB(End-of-Block) 为 块 结束 符 。 这 样 ， 只 需要 
10 METRIH. А2 7у10/64=15.6%. 2х 
简单 的 一 种 游程 编码 方法 ， 事 实 上 ， 由 于 块 中 元 素 
的 最 大 个 数 为 64， 因 此 不 可 能 产生 超过 64 长 虎 的 游 
程 ， 故 编码 游程 程度 时 只 需要 6 个 比特 位 即 可 。 上 
述 编 码 方法 中 ， 用 一 个 字 市 来 编码 游程 长 度 ， 浪 费 
了 两 个 比特 。JPEG 编 码 中 实际 及 用 的 游程 编 公 方法 
钱 上 述 方 法 复杂 ， 考 虑 到 更 多 的 细节 因 冯 ， 但 基本 
原理 是 相同 的 。 


对 于 游程 编码 ， 本 章 不 给 出 早 独 的 Visual 
C++ 实 现 ， 而 是 整合 在 10.8 节 的 综合 案例 中 。 


10.7 JPEG#TIJPEG2000JF Z: Er E 


(* jpeg) #l (*.jpg) 格式 图 像 古 当前 主流 的 

图 像 文 件 格 式 。 它 们 采用 的 束 古 JPEG 压 罗 标 准 。 
JPEG 古 联合 图 像 专家 组 (Joint Photographic Experts 
Group) 的 顷 与 。 由 国际 标准 化 组 织 (ISO) 、 国 际 
电报 电话 咨询 委员 会 (CCIT) 和 国际 电工 委员 会 
CEC) 一 下 致力 于 图 像 的 标准 化 工作 ， 荫 终于 
1993 年 推出 了 连续 色调 的 灰 度 或 彩色 静止 图 像 压 统 
编码 格式 一 一 JPEG 标 准 。 


JPEG 提 供 了 两 种 基本 的 压缩 编码 技术 ， 即 基 
于 DCT 变 换 的 有 损 压 缩 和 基于 DPCM 的 无 损 压 缩 ， 
两 者 均 可 采用 多 种 操作 模式 实现 ，JPEG 提 供 的 操作 
模式 有 以 下 几 下 。 


(1) WFR. MESTERNE AE E, 
MER F, — eka o 


(2) 累进 编 合 。 图 像 编 但 在 多 次 扫 摘 中 完 
成 ， 接 收 电 能 体验 到 图 像 多 次 扫 摘 ， 从 和 模糊 逐渐 杰 
清晰 的 过 程 。 

(з) 无 损 编 码 。 采 用 DPCM 预 测 编 码 ， 可 以 
精 傅 恢复 原 图 像 。 


(4) 分 层 编码 。 在 多 个 分 状 率 进行 编码 ， 在 
信道 较 慢 或 接收 端 分 辨 率 较 低 时 ， 可 以 只 完成 低 分 


PEZE ПУЛУ o 


Л Ан I 25 Em 2k HDCTIRR, EIn 1 
KHDPCMIX Ж MIm АЈ PK HI IDCTIx 
术 ， 也 可 以 采用 DPCM 撤 术 。 对 于 每 一 种 操作 柑 
式 ， 实 际 当 中 采用 的 大 部 分 为 基本 顺序 编码 模式 ， 
人 航 称 为 JEG 基 本 系统 (BaseLine) 。 


其 编码 硕 和 解 公 僻 框 多 如 图 10.17 上 所 示 。 
随 着 网 络 的 发 展 ，JPEG 显 示 出 以 下 一 些 浆 


。 在 人 码 率 低 于 0.25bit/ 像 系 时 ， 图 像 会 出 现 明 显 的 
防 控 效 应 。 

。 不 能 在 单一 码 流 中 实现 有 损 和 无 损 压 纵 ， 从 而 
KWAA i BIEI HI R EAN H o 

。 MEH TRD REAM AEE КАЯН. 

° PIRREJI Z o 





(b) 解码 器 


410.17 JPEG 基 本 系统 原理 框图 


为 了 弥补 这 些 不 足 ，JPEG2000 标 准 于 2000 年 
正式 推出 。JPEG2000 使 用 离散 小 波 变 换 (DWT) 
作为 变换 编码 方法 ， 对 变换 后 的 DWT 系 数 进 行 量 
1, Ию, Pea TK s a ЖЕЛИ Ян Ja АУ Ja 
组 织 成 压缩 码 流 输出 。 整 形 的 离散 小 波 变换 可 以 实 
现 图 像 从 有 损 到 无 损 的 渐进 传输 ， 且 离散 小 波 变换 
针对 整 幅 图 像 操 作 ， 不 存在 方块 效应 的 问题 。 


ERMEE, JPEG20002X:H ЖКУ) 
Н жж АИК Ж 000, Pana / КАЯН 
Ko МАМЛА А АМУ Н] А RAET 
目标 但 对 的 压缩 ， 还 可 提高 信 噪 比 ， 可 分 级 传输 。 


аР L, BENAR, JPEG20001432X25 БМ 5 
主流 的 压缩 格式 。 


10.8 Visual C++ 综合 案例 一 ”类 


似 JPEG 的 网 像 压缩 


JPEG 是 当今 主流 的 静止 网 像 编码 标准 ， 本 节 
TE Visual C++ 中 实现 一 个 价 单 的 图 像 压 缩编 码 左 ， 
原理 与 JPEG 类 似 ， 采 用 DCT 变 换 和 霍 夫 曼 编 码 技 
术 。 且 与 JPEG 一 样 ， 在 DCT 变 换 后 对 系数 进行 量 
化 ， 做 Z 形 扫描 、 游 程 编 码 ， 最 后 再 进行 霍 夫 曼 编 
Bu, 


Жн ZEH H e 848x8 R AERE жж BJ r E IM 
一 下 改变 ， 使 得 左上 角 的 系数 排 在 前 面 ， 原 理 如 图 
10.18 所 示 。 





CT 变换 和 量化 的 函数 代码 见 10.2 市 。 


HZH KA ZigZag ZT H PK 
2017 = 均 接 受 一 个 8x м 维 效 组 作为 输 


和 入， 输出 一 个 扫描 后 的 8x8 整 形 一 维 数 组 。 代 码 如 
下 


A ЕЕЕ ЕЕЕ ЕЕ 
void CImgProcess::ZigZag(int *in, int *out) 
功能 : 执行 Z 形 扫 插 
参数 : 
int *in: 输入 的 8x8 int 一 维 数 组 指针 
int *out: 输出 的 8x8 int 一 维 数组 指针 
jx [н|{Ң: 
2 
ОВОО k pt EEEE i 
void CImgProcess::ZigZag(int *in, int *out) 
{ 

int 1,7; 

for(i=0;i<8; i++) 

for(j=0;j<8; j++) 
out| ZTable[|i][j] | = in[i*8+j]; 

J 


A ЕЕЕ ЕКЕ ЕЛЕЕ ЕЕЕ ЕКЕ ЕЕ 
void CImgProcess::iZigZag(int *in, int *out) 
功能 : 3417/5243 
参数 : 
int *in: 输入 的 8x8 int 一 维 数 组 指针 
int *out: 输出 的 8x8 int 一 维 数组 指针 
返回 值 : 
2 
ЕОР ИЕ ЕЕЕ. 
void СІтеРгосеѕ5::121р2ар(іпі *in, int *out) 
l 

int 1,7; 

for(i=0;i<8;i++) 

for(j=0;j<8; j++) 
out[ i*8+j | = in[ZTable[i][j]]; 


Ú... 
ZJ TIR BJ keys в | И) Ж?Н ЗЕ, 
在 文件 开头 定义 。 


// Zz 形 扫 摘 表格 

int ZTable[8][8]={ 0,1,5,6,14,15,27,28, 
2,4,7,13,16,26,29,42, 
3,8,12,17,25,30,41,43, 
9,11,18,24,31,40,44,53, 
10,19,23,32,39,45,52,54, 


20,22,33,38,46,51,55,60, 
21,34,37,47,50,56,59,61, 
35,36,48,49,57,58,62,63 





实现 游程 编 公 的 核心 水 数 为 RunLen()， 输 出 的 
编码 结果 为 长 度 为 n 的 char 型 数组 ;游程 解码 的 核 
心 印 数 为 让 unLen0， 接 用 一 个 长 度 为 n 的 char 型 数 
组 ， 解 公 为 8x8 整 形 一 维 数 组 。 代 人 码 如 下 。 





下 


void CImgProcess::RunLen(int *in, char *out, int &п) 
功能 : ЗИТ У 

参数 : 

int *in: 输入 的 8x8 int 一 维 数 组 指针 

char *out: 输出 的 char 一 维 数组 指针 

int &n: char *out 中 元 系 的 个 数 

返回 值 : 


无 


ЕТТЕ ТЕРЕТ ETEEN EEEE f: 
void CImgProcess::RunLen(int *in, char *out, int &n) 
{ 

int 1; 

// WRR NEERA F PA 

int nmax=-1; 

for (i=63; i>=0; i--) 


if(in[i] !=0) 
{ 
птах=1; 
break; 
J 
J 
1# (nmax == -1) 
{ 
оиї[0 ]=0; 
ои[1]=127; // 127 为 结束 从 
п=2; 
return; 
} 
int j=0; 
int z=0; 
out[0] = іп[е]; 
ј++; 
for (1=1; і<птах+1; i++) 


if(in[i]!=0 ) 
{ 
оиї[ 5] = Z; 
j++; 
if (in[i]==127 ) //|| in[i]==-1 
out[j]= in[i]-1; 
else 
out[j]= in[il; 


2=0; 
yelse 
l 
Z++; 
J 
} тё 
out[j]=127; // 结束 标记 
n=j+1; 


) 


ЕЕ БК ЕЕЕ ЕЕ КЕБ ЕЕ ТЕКЧЕ ЕЗЕК КОБЕ КОБЕ КЕ ЕЕ 


void CImgProcess::iRunLen(char *in, int n, int *out) 
功能 : MITEN NE 


参数 : 

char *in: 输入 的 char 一 维 数组 指针 对 于 一 个 8x8 的 块 
int n: char *in 中 元 系 的 个 数 

int *out: 解码 得 到 的 8x8int 数 组 

5 БИН: 

无 


下 
void CImgProcess::iRunLen(char *in, int n, int *out) 
{ 
if (int(in[n-1]) != 127) 
return; 
memset(out, Ө, sizeof(int)*64); 
оит [е |=іпЕ(іп[е]); 
int 1=1; 
int j=0; 
while ( i<n ) 
{ 
if (int(in[i])==127) 
ргеак; 
j+=int(in[i])+1; 
i++; 
out[j]=in[i]; 





将 8x8 块 的 DCT 变 换 、 量 化 、Z 形 扫描 和 游程 编 
5 Е РА 4 0ОсЕСодеВ1іоск() P, ЗЕ itd TERAS 
Жк ы А И; MERA DEI, МУЛЯ 
їн, БУ DCT2F1844 P8 x8 R HIERIE E RTE 
РЁ iDctCodeBlock0 F, ЖМ F. 


[ECTE Ек ЕЕ ЕЕЕ БЕ ЕЕЕ ЕНЕ КЕЕ ЗЕ ЕЕ ЕЕ ЕЕЕ 


int CImgProcess::DctCodeBlock(double *dIn, FILE *p) 
T 从 dIn 中 输入 8x8 数 组 ， 编 码 后 保存 在 p 指 同 的 文件 中 
double *dIn: 8x8 数 组 

FILE *p: 保存 压缩 结果 的 文件 指针 

返回 值 : 

int: ЖАЛ 77 Ж 


ЖЕКЕ ЕЕЕ КЕЕ ЕЕЕ pay typy 


int CImgProcess::DctCodeBlock(double *dIn, FILE *p) 
l 


double ad dct|[64]; 
int ia[64]; 

int ib[64]; 

char ic|[256]; 

int nn; 


// DCT 变 换 
dct8x8(dIn, аа dct); 


// 量化 


quant(ad dct, ia); 


// Zz 形 扫描 
ZigZag(ia,ib); 


// Ўн 
RunLen(ib, ic, nn); 


іс[пп ]=0; 


// 将 结 末 号 入 文件 


int i; 
for (i=0; i<nn; 1++) 
l 
fwrite(ic+i, 1,1, p); 
J 


return nn; 


) 


ЕЛЕЕ ЕЕЕ ВОНО ЕЕ ЕСЕ ЕЕ 


void CImgProcess::iDctCodeBlock(FILE *p, double *dOut ) 
功能 : Mtt pia Н ТЕНЕ ЕА ВЈ, ДЕЧ 8х8 
参数 : 
FILE *p: 输入 的 文件 指针 
double *dout: ”解码 得 到 的 8x8 像素 指针 
JZ НИЕ: 
2С 
和 
void CImgProcess::iDctCodeBlock(FILE *p, double *dOut ) 
l 
char acBuf|[256]; 
int i=0; 
int iRun[64]; 
int iZig[64]; 
double dQuan[ 64]; 


// 读 取 文件 


while(!feof(p)) 
{ 


int t=fgetc(p); 
acBuf[|i]=t; 
if (int(acBuf[i])==127) 
break; 
i++; 
J 
і++; 
acBuf| i]=0; 
// ЎЗА 


iRunLen(acBuf, i, iRun); 


// 反 Z 形 扫描 
iZigZag(iRun, iZig); 
// RÆK 
iquant(iZig, dQuan); 


// 反 DCT 变 换 
idct8x8(dQuan, dOut); 


为 了 完成 对 整 幅 图 像 的 操作 ，DctCodeBlock() 
MiDctCodeBlockO A 8282727148 2 ТЕ РЁ Ж 
dct_quan_runlrnO 和 idct quan_runlrnO 中 ， 代 码 如 


О 


站 


void CImgProcess::dct quan runlrn(FILE *p) 


功能 : ХУВИА ТРСТА. шї, ФКН, HRF 
至 指针 p 指 回 的 文件 中 

参数 : 

FILE *р: 存储 压缩 结果 的 文件 指针 

jB БИН: 

int: 压缩 结果 所 占 的 字 节 数 

¿iu a ЕЕЕ Sp u ЕЛЕЕ / 


int CImgProcess::dct_quan_runlrn(FILE *p) 


l 
int nByte=0; 


int i,J,m,n; 
for (i=0; i<m_pBMIH->biHeight/8; i++) 
l 
for (j=0; j<m_pBMIH->biWidth/8; j++) 
l 
double dt[64]={0.0}; 


for (m=0; m<8; m++) 
for (n=0; n<8; n++) 
dt[m*8+n] = (double)GetGray(j*8+n, i*8+m); 


nByte += DctCodeBlock(dt, p); 


} 
} 


return nByte ; 


ааа 


double CImgProcess::idct quan runlrn(CImgProcess *ртТо, 
FILE *p) 

功能 : 从 指针 p 指 问 的 文件 中 读 进 内 容 ， 解 压 到 pTo 指 癌 的 图 像 类 中 
参数 : 

CImgProcess *pTo: 图 像 类 的 指针 

FILE *p: 存储 压缩 结束 的 文件 指针 

返回 值 : 


double: рТо1Ё [=] ЕЁ) ЇЗ ТЕҖЕ ЖЕ a A АЧ FAM, H 
于 计算 信 品 比 
аа ETETETT 
double CImgProcess::idct quan runlrn(CImgProcess *ртТо, 
FILE *p) 
l 

double f=0.0; 

int wn=m pBMIH->biWidth/8; 

int hn=m pBMIH->biHeight/8; 

int i,J,m,n; 

for (i=0; i<hn; i++) 

l 

for (j=0; j<wn; j++) 


double аї[64 |; 
iDctCodeBlock(p, ат ); 
for (m=0; т<8; m++) 
{ 
for (п=0; п<8; п++) 
{ 
double Ғ1=рТо->беїбгау(ј*8+п,і*8+т) ; 
double d = dt[m*8+n]; 
if (d<0) 
d=0.0; 
if (9>254.5) 
0=254.0; 
unsigned char t=(unsigned сһаг) (іп) (а+0.5); 
рТо->Ѕе+Ріхе1(ј*8+п, i*8+m, RGB(t,t,t)); 
double f2=pTo->GetGray(j*8+n,i*8+m); 
f+=(fl-f2)*(fl-f2); 


—_ úO 


ЛН ра асе аоап_ гиопігп() асе quan _runlrn() 
З. Е НУУ ЕУ Же EDIPDemo TFE H ВА, 
26 р {уоіа CDIPDemoView:: OnMenuDct 0 中 ， 

该 函数 将 弹出 一 个 对 话 框 ， 用 户 可 选择 输入 或 输出 
文件 (后 级 必须 为 “*.dct”) ， 并 选择 “编码 ”或 “ 解 
但 ”， 了 最 后 单 击 “ 硝 定 ? 投 钮 。 在 OnMenuDctO 函 数 中 
调用 编 解 但 的 部 分 代 但 如 下 。 


CImgProcess ImgInput = pDoc->m Image; 
// 创建 对 话 框 

CDlgDCT dlg; 

dlg.m_path="lena.dct"; 


// 显示 对 话 框 ， 用 户 设 定 参 数 
if (dlg.DoModal() != ТООК) 
return; 


// ЕЕ Ri ЕҤ ЖЕН l 
double fs=0.0; 


// 更 改 光 标 形状 


BeginWaitCursor( ) ; 


CImgProcess imgOutput = імеІпри+; 
if (dlg.m rad==@) // 编 但 


FILE *p=fopen(dlg.m path, "wb"); 
if(NULL==p) 


АҒхМеѕѕавеВох ("221267581"); 


return; 


imgInput.dct_quan_runlrn(p); 
oaa ЫЛ 


CString m_s; 
m_s. е "编码 成 功 ! 图 像 数据 已 保存 至 %s ", dlg.m pat 


h); 
AfxMessageBox(m s); 


}else // ЯЕЦ 
{ 


FILE *p=fopen(dlg.m path, "rb"); 
if(NULL==p) 


AfxMessageBox(" 文 件 打 不 开 !"); 


return; 


} 

fs = imgInput.idct quan _runlrn(&imgOutput, p); 
fclose(p); 

pDoc->m_ Image = imgOutput; 


ТЕН AJ РА 3591, А908 Н 7205 Pe ju 
码 * 或 < 解码 ”， 图 数 分 别 调用 CImgProcess 类 的 
dct quan гипігп() K У #lidct_quan_runlrn(0 р 5. TZ 
者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜单 命 
«КИЯ > ЖАН ж” ЖП A ER ТЕЛЕ. 


压缩 图 像 的 操作 流程 如 下 。 
(1) 在 程序 主 界 和 面 打开 一 张 BMP 灰 度 图 像 ， 


如 图 10.19 所 示 ， 这 是 一 张 256x256 的 灰 度 网 像 。 


(2) 选择 荣 单 命令 “图 像 压缩 = 压缩 守 例 ” 
在 如 图 10.20 所 示 的 对 话 框 中 输入 编码 后 保存 的 文件 
名 ， 并 在 单 选 按钮 中 选择 “编码 ”。 


БАКЕТ ТЕТЕ — Пепи. Љар] Е K 
EI wE япан) LETRE MERDO MMEO eR C) 形态 学 变换 0 
рава ED ә = 
[Ыы еә 
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DCI. mik. Жав 


үг 
F:“ 编 码 . det Ё н. 


全 „ С Ai 


确定 | më | 





410.20 ЖГ [ЖТ ҤЕ ЇР 


(3) тШ“ =” ЖЕП m, ЖАЙ 
Ән, БАЛУ h an 10.2128 HJ ЖГ ИЕ ЙЕ o 





图 10.21 编码 成 功 对 话 框 


(4) 此 时 只 完成 了 DCT 变 换 、 量 化 、Z 形 扫描 
MPTE, PAPIT ER Smo ER S gtg 
的 原理 和 Visual C++ 实 现 已 在 10.4 节 有 所 介绍 。 选 
ABAE -ERS н ЫЫ” 45, ТЕЙ 10.227 
示 的 界面 中 选择 上 一 步 的 编码 结果 “编码 .dct” 作 为 
和 输入， 并 早 击 “编码 ”按钮 。 


TJE, 6. Wi RAFAJ 
但 .dcthuf”， 文 件 大 小 为 9924 字 节 。 而 原 图 像 为 
256х2561/ 4, 1х /%\256х256=655365 
节 ， 压 缩 效 率 达 到 了 9924/65536= 15.14%. 


МЕЛ AE HIERIE IRIENN P à 


下 面 从 “FA 编码 .dcthuf> 中 解码 。 注 意 ， 访 文件 
只 压 纵 了 图 像 的 数据 区 ， 不 包括 BMP 图 像 的 文件 
k, EELER, AEM R SE BAAI IAR 
S EBRLE Rn A EETA F, Aa RE 
导致 解码 图 像 显 示 失 败 。 


ГЕТ 


ГЕТЕ АС {А “N 
wA EPF: Ü РН “ч 


F* 编 码 .dct “浏览 | 
яш N PF: 
FAT .dcthuf АЙ Т], | 


解码 +y i 101110 


ЕРЕЕН BEF i ЖЕЛ 


PF43238: 

平均 人 码 长 : 
ЖЖ. 
编码 效率 : 





410.22 ÆR = hH e pk 


(1) BEM > ER S Za Eli” an 4, 
在 如 网 10.23 上 所 示 的 界面 中 选择 “FE 编码.dcthuf> 作 
为 输入 ， 并 将 输出 文件 路 径 设 为 “fF:\ 解 公 .dct”。 蛙 
击 “ 解 码 ” 按 钮 。 
жещ 
тта АВСД. | Në 
кйш щй ||! 


255 
яш УР: 
FAA. dct eFI гй | 


编码 || 解码 | 关闭 | 





410.23 ÆR = fH e pk 


(2) A BASEA Ea. РЈ КАЯН 2 1⁄1” 323 
单 俞 令 ， 在 如 图 10.24 所 示 的 对 话 杠 中 输入 上 一 步 解 
但 的 结果 “FA 解码 .dct>， 并 在 单 选 按钮 中 选择 “ 解 
ш”, 


DCI. mik. Жав 


РЕ 
Е ХШ ЕЧ. det УП | 


С 810 


取消 





410.24 ”选择 竺 解码 的 〈*.dct) 文件 


(3) 单 击 “确定 ”按钮 ， 系 统 即 开始 解码 ， 最 
终 显 示 解 码 所 得 的 图 像 ， 并 显示 该 图 像 相对 原 图 的 
峰值 信 噪 比 (PSNR) ， 如 图 10.25 所 示 。 


如 图 10.25 所 示 ， 最 终 的 解 公 结果 与 原 图 看 上 去 
没有 区 别 。PSNR 值 接近 34， 一 般 PSNR 超 过 30 时 肉 
眼 即 难以 分 辨 出 明显 区 列 ， 因 此 这 样 的 图 像 质 量 可 
以 满足 日 常生 活 的 需求 。 


+ 教 字 图 你 处 理 与 机 器 视觉 补 步 – [lenall.bap] 
TFE ALAE Jln йс) Елата (T) АЕ (0) РА ЕАР (C) АЕА O) 

Б йл ПШ) 特征 提 职 好 ) АНЫЦ Е) ЕЕ Е) ==) ЫП) ЖЕН 

Бых %&ю|ө|?| 





Жи Б] ЭЕ БЛ НЕ Лу, ЛЬ 





410.25 ”最 终 解码 结果 


使 用 另 一 张 图 片 man.bmp 进 行 测试 的 结果 如 图 
10.26 所 示 。 压 缩 后 的 文件 大 小 为 10364 字 节 ， 压 缩 
+ 5у15.819%. 





Г. 数字 图 像 处 理 与 机 器 视 总 初步 一 [man.bmp] 
TFD SZE Лача (с) HRR MMEO Н с) КЕЗЕЙ) Ë 
Бы вее ® 





ЗЕТЕ НН БАЛЕ 





410.26 тап.Ьтр! 125 


Yd => 


(1) 以 上 压缩 算法 仅 针 对 8 位 BMP 图 的 图 像 数 据 部 分 进行 压缩 ， 
因此 如 条 打开 原 图 后 进行 了 压 纵 ， 驻 打开 了 万 一 张大 小 不 同 的 图 亡 ， 
此 时 如 朵 解压 刚才 压 迪 的 文件 ， 因 其 文件 头 信 息 不 相同 ， 束 可 能 出 现 


hiw, 


(2) 解压 时 显示 的 峰值 信 噪 比 (PSNR) 是 解压 结果 与 当前 图 像 
的 信 品 比 。 如 果 已 经 解压 了 一 次 ， 那 么 当前 图 像 已 经 更 新 为 解压 后 的 
图 像 了 。 如 果 此 时 再 次 对 压缩 文件 进行 解压 ， 束 会 由 于 当前 图 像 与 解 
压 结果 完全 一 人 改 而 使 PSNR 值 显示 为 100， 如 图 10.27 所 示 。 


Жуст El нн ВЕЕ амра 





410.27 图像 完全 相同 时 PSNR 设 定 为 100 


第 11 章 ”形态 学 图 像 处 理 


gz 态 学 ， 即 数学 形态 学 (“Mathematical 

Morphology) ， 是 图 像 处理 中 应 用 最 为 广泛 的 扩 术 
之 一 。 其 主要 应 用 是 从 图 像 中 所 取 对 于 表达 和 手绘 
区 域 形 状 有 意义 的 图 像 分 量 ， 使 后 续 的 识别 工作 能 
WIU: HRR RENA (最 具 区 分 能 力 most 
discriminative 〉 的 形状 特征 ， 如 边界 和 连 授 区 域 
чє; BERRA BRUIR ER SETAR E 
常 应 用 于 图 像 的 预 处 理 和 后 处 理 中 ， 成 为 图 像 增 强 
ANRA ЈАК -o 


А FE J RIR RIS ЛС A 


(1) 二 值 图 像 的 基本 形态 学 运算 ， 包 括 府 
її, ИЖ. JAB 


(2) 二 值 形态 学 的 经 典 应 用 ， 包 括 击 中 击 不 
中 变换 、 边 界 提取 和 跟踪 、 区 域 填 元 、 提 取 连 通 分 
量 、 细 化 和 像 系 化 以 及 凸 元 


(3) ЖАРИ е2 А, БЕЛЛЕ 
їй, KEER KEHMKEH 


AS Н ЖЛ УТ 





(1) 在 人 脸 局 部 图 像 中 定位 跨 的 中 心 
(2) 显 做 镜 下 图 像 的 细 孙 计数 


(3) 利用 顶 帆 变换 (top-hat〉 技术 解决 光照 
ANEY іа] дй 


111 预备 知识 


在 数字 图 像 处 理 中 ， 形 态 学 是 借助 集合 论 的 语 
言 来 描述 的 ， 本 章 后 面 的 各 节 内 容 均 以 本 节 要 介绍 
的 集合 论 为 基础 


在 数字 图 像 处 理 的 形态 学 运算 中 ， 币 种 把 一 幅 
图 像 或 者 图 像 中 1 个 感 兴 趣 的 区 域 称 作 和 集合， 用 大 
与 字母 A 、B 、C 等 表示 ; 而 元 系 通 各 是 指 1 个 单个 
的 像 系 ， 用 充 像 系 在 图 像 中 的 整 型 位 置 坐标 z =(z 
1，z 2) 来 表示 ， 这 里 z EZ“， 其 中 Z“ 为 二 元 整数 有 
序 俩 对 的 集合 。 


下 和 面 介 绍 一 些 集合 论 中 的 重要 天 系 。 
1. 集合 与 元 系 


属于 : WTR- RE (BAXIR A, жа 
在 A 之 内 ， 则 称 a 为 A WIA, a 属于 A ， 记 作 a 


EA; 反之 ， 若 点 b 不 在 A 之 内 ， 称 b 不 属于 A ， 记 
作 s# 4 ， 如 图 11.1 (а) 所 示 。 


集合 与 集合 


并 集 : C= 1212 CA orz ЄВ }, ЛЕС = А В 
‚ ША УВ 的 并 集 C 包含 集合 A 与 集合 B 的 所 有 元 
素 ， 如 图 11.1 b) 所 示 。 


XE: C={z|zEAandx EB}, 1ЕС =A B 
‚ ПА 与 B 的 交集 C 包含 同时 属于 集合 A 与 集合 B 
的 所 有 元 系 ， 如 图 11.1 (с) 所 示 。 


МФ: АС={2|2#А }, ША 的 补 集 是 不 包含 于 / 
的 所 有 元 系 组 成 的 集合 ， 如 网 11.1 d) MR- 


EWR, 4-B={fzlxs4zeBl=4npBs， 即 A 与 B 的 天 
集 由 所 有 属于 A 但 不 属于 B ETARA, wB 
11.1 (е) 所 示 。 


8: 集合 A 的 每 个 元 又 都 是 态 一 个 集合 B 的 1 
DNIA, MH] EK 称 A 为 B 的 子 集 ， 记 作 Ac B, wh 
11.1 (£) 所 示 。 
3. 反射 和 平移 


А: 义 名 对 称 ， 定 义 为 B={:|:=-bbe B), T 


作 # ， 如 图 11.1 (g) 所 示 。 


平移 : 将 集合 B 平移 a 到 点 z =(z 1，z 2)， 定 义 为 
(В). = {rlz=b+%be B}, WEB): , ИД 11.1 (h) 所 示 。 


де М 
0 小 
` 
А 





сф) 
oE 


= 
„Мм. 
集合 的 天 
天 系 和 运 
运 
L 


=: 
11 
.1 


4. 结构 元 素 (Structure Element) 


设 有 两 幅 图 像 A 、S 。 若 A 是 被 处 理 的 对 象 ， 
而 S 是 用 来 处 理 A BJ, MPKS NAJIR, MJE 
RA рк ШЕ ЛЕН, А 55 的 关系 类 似 
于 滤波 中 图 像 和 模板 的 关系。 


11.2 二 值 图 像 中 的 基本 形态 学 运 
= 


本 市 介绍 几 种 二 值 图 像 的 基本 形态 学 运 拭 ， 包 
ТАЛАА, Ж ЛК, МЛ, Иа. 


由 于 所 有 形态 学 运算 都 是 针对 图 像 中 的 前 景物 
SREATH, A A eX EAEI RA E RIA E h 
DE НУТ Н. 





ww 


WT KZ 1, RIXTE БАШ ы ИЛКИ KRE) 更 

深 ， 二 值 化 之 后 物体 会 成 为 黑色 ， 而 背景 则 成 为 白色 ， 因 此 通常 更 习 
惯 于 将 物体 用 黑色 〈 灰 度 值 0〉 表示 ， 而 背景 用 白色 《〈 灰 度 值 255) 表 
示 ， 本 章 所 有 的 算法 示意图 以 及 所 有 的 Visual C++ 的 程序 实例 都 于 从 这 
种 约定 ; 但 MATLAB 在 二 值 图 像 形态 学 处 理 中 ， 默 认 情 况 下 白色 的 (二 
值 图 像 中 灰 友 值 为 1 的 像 系 ， 或 灰 皮 图 像 中 灰 度 值 为 255 的 像 系 ) 是 前 景 
(物体 ) ， 黑 色 的 为 背景 ， 因 而 本 间 涉 及 MATLAB 的 所 有 程序 实例 文 
都 这 从 MATLAB 本 和 刁 的 这 种 前 景 认定 习惯 。 所 以 图 11.2 中 的 两 幅 图 像 
对 于 Visual C++ 和 MATLAB 来 说 从 形态 学 处 理 的 意义 上 是 等 同 的 。 





(а) VisualC++ 中 ， 人 脸 区 域 〈 黑 色 ) 为 前 (b) MATLABĦ, ARKA (白色 ) 为 前 景 
景 ， 最 外 围 的 黑 边 框 是 为 显示 出 图 像 整体 的 
边界 而 设置 的 ， 并 不 是 图 像 本 身 的 一 部 分 


11.2 MATLAB 和 Visual C++ 中 习惯 上 对 于 网 像 前 景 与 背景 
的 认定 
实际 上 ， 无 论 以 什么 灰 度 人 为 前 景 和 育 景 都 只 

是 一 种 处 理 上 的 习惯 而 已 ， 与 形态 学 算法 本 喘 无 
天 。 例 如 对 于 上 面 的 两 幅 图 厂 ， 只 需要 在 形态 学 处 
理 之 前 先 对 图 像 反 色 ( DIPDemoFE Ве KRA 
令 “ 文 件 Б) 束 可 以 在 两 种 认 守 习 КШ 
目 由 切换 。 


此 外 ， 虽 然 本 节 中 处 理 的 仅 是 二 什 几 月， 但 在 
Visual C++ 中 ， 为 处 理 方 便 ， 还 是 采用 256 级 灰 度 
图 ， 不 过 只 用 到 了 其 中 的 0 和 255 两 项 。 


11.21 ”腐蚀 及 其 实现 


雇 蚀 和 脖 胀 是 两 种 最 基本 也 和 古 最 重要 的 形态 学 
运算 ， 因 为 它们 是 后 续 要 介绍 的 很 多 融 级 形态 学 处 
理 的 基础 ， 很 多 其 他 的 形态 学 算法 都 是 由 这 两 种 基 
本 运算 复合 而 成 的 。 下 面 匈 介绍 腐蚀 ， 在 11.2.2 小 
TH rR JY ZR] ç 


1. 理论 基础 


对 Z“ 上 元 素 的 集合 A MS, EHS 对 A 进行 腐 
蚀 ， 记 作 AeSs ， 形 式 化 地 定义 为 : 


Aeg9={z|(3). S A) 
(11-1) 


让 原本 位 于 图 像 原点 的 结构 元 素 S 在 整个 Z“ 平 
面 上 移动 ， 如 果 当 S 的 原点 平移 至 z 点 时 ，S 能 够 完 
全 包含 于 A 中 ， 则 所 有 这 样 的 z 点 构成 的 集合 即 为 $ 
对 A 的 腐蚀 图 像 ， 如 图 11.3 所 示 。 





A у за/4 a/g 
(а) 集合 (b) ЕЛЖ Co) B 对 4 腐蚀 后 的 结果 


RB Сым 


АӨВ 
B 
d/8 3d/4 d/8 
(d) 拉 长 的 矩形 结构 元 系 (e) H (d) 中 结构 元 又 对 4 腐蚀 的 结果 


113 ЈА (ЁТ ГТ ЕЛЖ ШКА.) 


采用 原点 位 于 中 心 的 3x3 对 称 结 构 元 又 的 搬 蚀 
运算 效果 如 图 11.4 所 示 。 访 效果 是 由 在 随 书 光盘 中 
提供 的 MorphSimulator 工 具 实 现 的 ， 读 者 可 以 在 第 
11 章 的 Tools 目 录 中 找到 此 工具 。 本 章 所 有 的 形态 学 
运算 效果 均 可 由 MorphSimulator 模 拟 ， 访 工具 使 用 
非常 价 单 〈 详 见 同 目录 下 的 help.txt 文 件 ) , E REE 
将 形态 学 运算 的 效 末 放大 化 ， 用 每 1 个 方 格 代表 1 个 


像 系 ， 从 而 可 以 非常 直观 地 感受 运算 效 末 ， 帮 助 初 
学 者 更 快 地 理解 各 种 形态 学 算法 。 





(a) 原始 图 像 4 (b) 结构 元 系 S (c) ASS 
图 11.4 ”腐蚀 运算 效果 模拟 


下 面 再 来 看 一 个 非 对 称 结构 元 素 腐蚀 的 示例 。 
如 图 11.5 所 示 ， 结 构 元 系 的 原点 在 图 中 以 “O ” 标 


ЕЕ 





(a) 原始 图 像 4 (b) 非 对 称 结构 元 系 S (c) AOS 


图 11.5“” 非 对 称 结构 元 又 的 腐蚀 
Е: (b) 中 像 系 格 内 的 “O "л, “X "K 


示 访 位 置 的 值 读 者 并 不 关心， 和 后 会 对 “X ”的 意义 
加 以 解释 。 

Мата яа КЛМ IR HIJAN 
AKR, МЫ? TEI RMA A JHR. WIA 
М5: BERF E11.4rB Ну ЖА, РА 


МАЎ, Н ТЕ ЗА ЕН ЇН] ЖУ лж Е, 
会 得 到 什么 样 的 结果 呢 ? 


2. MATLAB 实 现 


MATLAB 中 和 愉 蚀 相 天 的 2 个 第 用 孙 数 为 
imerode() 和 和 strel()。 


(1) imerode0 函 数 用 于 完成 图 像 腐 蚀 ， 其 第 
用 调用 形式 如 下 。 


I2 = imerode(I, SE); 


参数 说 明 : 


° 为 原始 图 像 ， 可 以 是 二 值 或 灰 度 图 像 〈 对 应 于 
ЖЛЕ) ИҢ) ; 
° SE натй ра ЖА E] HJ Н х X nk ЙИ Н) JÚ 


í "N 


返回 值 : 
。 了 2 为 奉 蚀 后 的 输出 图 像 。 
(2) strel0) 了 水 数 可 以 为 各 种 剃 见 形态 学 运 宽 生 
成 结构 元 系 SE ， 当 生成 供 二 值 形态 学 使 用 的 结构 
TAH, ЯМАМ. 


SE = strel(shape,parameters); 


参数 说 明 : 


° shape 指定 了 结构 元 素 的 形状 ， 其 第 用 的 合法 取 
值 如 表 11.1 所 示 。 


2111 HFEA shape 参数 

















'pair' 








° parameters 是 和 输入 shape 有 有 有关 的 参数 。 





返回 值 : 
° SE 为 得 到 的 结构 元 素 对 象 。 
下 面 结合 一 些 代 表 性 的 情况 其 体 说 明 。 


О) SE = strel('arbitrary', NHOOD) 1% [H| —4 
HNHOOD зах 21470. AP, NHOOD 为 一 
个 只 包含 "02 和 “1 的 窍 阵 ， 规 定 了 结构 元 系 的 形 
状 。 结 构 元 系 的 中 心 位 于 NHOOD 矩阵 的 中 心 位 
=, Elifloor((size(NHOOD )+1)/2). + PERET 
Эл, “JJ JSE = strel(NHOOD) 的 形式 。 


(2) SE = strel('disk', В) [H] — 24278 的 
形 结构 元 系 。 
(3) SE = strel('‘pair"，OFFSET) 返 回 一 个 只 包含 2 


个 “1” 的 结构 元 系 。 其 中 1 个 “1” 位 于 原点 ， 男 1 
个 “1” 相 对 于 原点 的 位 置 由 OFFSET 向 量 指 


ж. OFFSET z£“ TSS 2819], OFFSET (1) 
是 x 方向 的 偏 移 量 ，OFFSET (2) 是 y 方向 的 偏 移 
量 。 


(4) SE =strel(Trectangle'，MN) 返 回 一 个 局 、 帘 
均 有 向 量 MN 指定 的 矩形 结构 元 素 。MN 是 一 个 长 
EAW AE, MN (1) 是 结构 元 素 的 高 度 ，MN (2) 
де ZH ЛУ) 7 НЕ 





由 于 形态 学 运算 中 的 结构 元 素 通 常 都 具有 一 定 的 尺寸 ， 当 结构 元 
系 位 于 图 像 边缘 时 ， 其 中 的 菜 些 元 系 很 可 能 会 位 于 图 像 之 外 ， 这 时 和 需 
要 对 于 在 边缘 附近 的 操作 单独 处 理 ， 以 避免 引用 到 本 不 属于 图 像 的 无 
意义 的 值 。 这 类 似 于 滤波 操作 中 的 边界 处 理 问 题 ( 见 5.2 节 第 2 小 
W) 。MATLAB 可 以 目 动 处 理 边 界 问 题 ， 而 在 Visual C++ 程 序 中 ， 采 
取 了 收缩 边界 的 东 略 ， 即 在 图 像 四 周 留 出 了 一 个 空 的 边界 不 做 处 理 ， 
有 些 算法 如 区 域 填充 和 提取 连通 区 域 等 需要 在 图 像 四 周 人 为 地 加 入 一 
个 空 的 边界 。 


ARREN: 顾名思义 ， 腐 蚀 能 够 肖 融 物体 的 
边界 ， 而 其 体 的 腐蚀 结果 与 图 像 本 里 和 结构 元 系 的 
МАКА. WIKA F KT ZH JG. ЯНУ 
EEDA R, < — [8 #I|JK 4 Z K> H 
结构 元 系 决 定 的 ; WRAEK Я Гл, Ж! 
在 腐蚀 后 的 图 像 中 物体 将 完全 消失 ， 如 物体 仪 有 部 
分 区 域 小 于 结构 元 系 〈 如 细小 的 连通 ) ， 则 腐蚀 后 
物体 会 在 细 连 通 处 断 农 ， 分 离 为 两 部 分 。 例 11.1 训 
HH УЛАА Т КАЧ Ж. 


[111.11] АН ЛЧ л ЖУ Со 


如 图 11.6 (а) 所 示 的 原始 图 像 中 ， 两 个 主要 的 
XE СЈАЕ) ， 中 间 用 一 个 宽度 为 5 的 条 形 
连通 市 ， 图 像 上 中 是 一 个 横 回 、 纵 回 长 度 均 为 3 个 
像 系 的 十 字 ， 位 于 图 像 展 部 的 3 个 正方 形 的 边 长 分 
别 为 3、5 和 6。 


采用 不 同 的 结构 元 系 对 图 11.6(a) 进 行 奉 蚀 的 
MATLAB 程 序 如 下 。 


>>I = imread( ‘erode dilate.bmp’); % 读 入 8 位 灰 度 图 像 
% 二 值 形 态 学 处 理 中 将 灰 虚 图 像 中 所 有 非 6 值 都 看 作 是 1， 即 前 景物 体 


>> figure, imshow(I); % 得 到 图 11.6(a) 

>> se = strel('square', 3) %3x3 的 正方 形 结构 元 素 
se = 

Flat STREL object containing 9 neighbors. 


Neighborhood: 
1 1 1 
1 1 1 
1 1 1 


>> Ib= imerode(I, se); %JS TH 

>> figure, imshow(Ib); % 得 到 图 11.6(b) 

>> 

>> se = strel([0 1 0; 1 1 1; © 1 0]) %3x3 的 十 字 结 构 元 素 
se = 

Flat STREL object containing 5 neighbors. 


Neighborhood: 
Ө 1 Ө 
1 1 1 


Ө 1 Ө 


>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 
>> 


Ic= imerode(I, se); % Ий 
figure, imshow(Ic); % 得 到 图 11.6(c) 


se = strel('square', 5) ;%5x5 的 正方 形 结构 元 素 
Id= imerode(I, se); % 腐 刨 
figure, imshow(Id); % 得 到 图 11.6(d) 


se = strel('square', 6); %6x6 的 正方 形 结构 元 素 
Ie= imerode(I, se); % 腐 刨 
figure, imshow(Ie); % 得 到 图 11.6(e) 


se = strel('square', 7) ;%7x7 的 正方 形 结 构 元 素 


If= imerode(I, se); % 腐 刨 
figure, imshow(If); % 得 到 图 11.6(f) 


上 述 程序 的 运行 效果 如 图 11.6 (b) ~K 


11.6 (f) 所 示 。 





NN 


(a) 原 图 像 erode dilate.bmp (b) 经 3x3 正 方形 结构 元 又 腐 伺 





N 


(c) 经 3x3 十 字形 结构 元 素 腐蚀 (d) 经 5x5 正 方形 结构 元 素 腐蚀 





(e) 经 6x6 的 正方 形 结构 元 素 腐 蚀 (f) 经 7x7 正 方形 结构 元 素 腐蚀 


图 11.6” 抑 蚀 对 不 同 物体 的 影响 《〈 为 使 图 中 前 景物 体 更 加 明 
и, ХРА РАСХ Г 3R EZR ) 


如 图 11.6(b〉 所 示 ， 原 图 像 经 过 3x3 的 正方 形 


TRAE, ШТЕР T JK uy su 
ел, Ий ҮН Жз ЛИКУ NEN 
№8) 210 ло ЛЛУ А 90, ВЕН Е ега 
№) лок, БТРДИ ҮН КОЈЕ РУНА: 
Ажо 88” ТЛУ. 


为 了 比较 效果 ， 图 11.6 (с) 中 换 用 了 3x3 的 十 
字 结 构 元 素 ， 这 时 图 11.6 (b) 中 消失 的 顶部 的 十 字 
pidea a ee e E 了 1 
个 中 心 像素 ， 还 需要 注意 的 是 连通 条 带 连 接 端 和 网 
11.6 (b) н 


411.6 (d) 中 采用 5x5 的 正方 形 结构 元 素 后 ， 
RAPIRA 2 22 28 /]\, кел ЕИ Ус 478 
Ж, Jay БАУ TEM 28 r Э F 
H (АЈ АУТА н ҤЕ ZÚ ç 


“411.6 (е) 中 正方 形 结 构 元 系 增 大 到 6x6 之 
е БАУ wM ERR H НЕШЕ БОД ЖЕТТ 
ЕЛУ лж, JAI ТЕ ИН АУР FER, 而 底 
部 也 只 有 原本 6x6 的 正方 形 物体 还 仅 存 1 个 像 承 。 


采用 7x7 的 正方 形 结构 元 系 庙 蚀 忆 后， 多 
11.6 (f) НАЖ АЕЛИК, ПАИ 
МТЕЛ А22 Я АР ЯН Y ЗАМ. 


(0111.19, БИЖ) ШЛУ НАК, P 
Тал НУУНУН Ж. H T J hier < FE HJ 
эел, БЇРАН ТЕЙМ» РЕЛЕ А K| HUEJAHJZG EJ 
жж, Нн Т ИНЕ а Ег Z J Jú Ж ИЛЕ 
Ра кд» Am. ЯШИ ИШЕК Н йд, ВЕ 
去 除 噪声 点 的 同时 ， 对 图 像 中 前 景物 体 的 形状 也 会 
有 影响 ， 但 当 读者 只 关心 物体 的 位 置 或 者 个 数 时 ， 
这 不 会 有 什么 问题 。 


3，Visual C++ 实现 


下 面 给 出 和 常用 的 3x3 的 结构 元 系 的 认 蚀 实现 ， 
АУУ Н] {Л НЕ ЕУ РЁ 29 
CImgProcess::Template( )28 5 SE 718 H BJ ИҢ 
Е. 


РЕТ В 


void СІтеРгосеѕ5: : Егоде(СІтеРгосеѕ5* pTo, int ѕе[3][3]) 

功能 : 3x3 usa HJ НЕДИ ЈА EL 

注 : 只 能 处 理 2 值 图 象 

参数 : 1таре* pTo: НМ АУ CImgProcess 指针 
se[3][3]: 3x3 的 结构 元 系 ， 其 数组 元 系 的 合法 取 值 为 : 


1 --- 前 景 

Ө --- 背景 

-1 шш 不 关心 
返回 值 ， 无 


РИИ ОРАР У, 


void CImgProcess::Erode(CImgProcess *рТо, int ѕе[3][3]) 
{ 
int nHeight = GetHeight(); 


int nWidth = GetWidthPixel(); 


int i, j; // 图 像 循环 变量 
int k, 1; // 结 构 元 素 循 坏 变 量 


bool bMatch; // 结 构 元 系 是 否 与 局 部 图 像 匹 配 
pTo->InitPixels(255); // 清 空 日 标 输 出 图 像 


// 逐 行 扫描 图 像 ， 为 防止 访问 越界 ， 四 周 留 出 一 个 像素 宽 的 空 边 
for(i=1; i<nHeight-1; i++) 
l 

for(j=1; j<nWidth-1; j++) 


{ 
ГЛЕНА нле ЗхЗ ЈМ, УУТ, ХУК ЕЛП 
最 下 的 两 行 像 素 以 及 最 左 和 最 右 的 两 列 像素 
bMatch = true; 
for(k=0; k<3; k++) 


for(l=0; 1<3; 1++) 


if( se[k][1] 
continue; 


-1 ) // 不 关心 


if( se[k][1] = = 1 ) // 前 景 


if( GetGray(j-1+1, 1-1+к) != Ө ) 


bMatch = false; 
һгеаК; 


} 
else if( se[k][1] = = 6 ) // ж 


if( GetGray(j-1+1, 1-1+К) != 255 ) 


bMatch = false; 
һгеаК; 


} 
) 


else 


{ 
AfxMessageBox(" 结 构 元 素 售 有 非法 值 ! 请 检查 后 
重新 设 定 。 " ) ; 


return; 


J 
}//for 1 
}//for k 


if( bMatch ) 
pTo->SetPixel(j, i, RGB(0, ©, 0)); 
y// for j 
}// for i 


Л H Erode) A RE EMA Jš E I TERR 7 
R TEDIPDemo TEF НЛ BIX K %tvoid 
CDIPDemoView::OnMorphErosion() 中 ， 其 中 调用 
Егоде() 11015 jr Br iH F ETZE o 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 Erode() 实 现 图 像 奉 刨 
imgInput.Erode(&imgOutput, se); 

//se 为 代表 结构 元 妹 的 3x3 人 整形 数 组 ， 根 据 用 户 输入 指定 。 默 认为 3x 
3 的 方形 结构 元 系 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设 置 
结构 元 勾 。 旋 者 可 以 通过 交 盘 中 示例 程序 DIPDemo 
中 的 及 时 命令 “形态 学 变换 愉 蚀 ”来 观察 处 理 效 
Ж. 


实际 上 ，Erode( ) РЁ J Г КИЛЕН) Uh Pa. 
法 。 对 于 3x3 的 结构 元 素 SE ， 人 允许 其 有 3 种 取 值 分 
别 代表 3 种 不 同 的 意义 ， 即 : 1 一 一 前 景 ;， 0—5 
景 ; -1 一 一 不 关心 。 这 样 当 结构 元 系 中 只 包含 1 和 -1 
ШЇ, Erode( ) 可 实现 标准 腐蚀 算法 的 功能 ， 此 时 的 -1 
与 MATLAB 中 愉 刨 结构 元 系 中 0 的 意义 相同 。 


例如 : 对 于 例 11.1 (b) rHH#JiE J JEZS JJ z< 


TA: 


se[3][3] = {4{1,1,1}, {1,1,1}, {1,1,1}}; 


对 于 例 11.1(c) "И 7с, e: 








—1 1 —1 
ве [3] [3] = {{—1,1,—1}, {1,1,1}, {—1,1,—1}} ; //se = | a 1 к | 


而 当 结 构 元 素 中 包含 0 时 ，Erode( ) 算 法 则 具有 
了 模板 罗 配 的 功能 ， 可 以 直接 适用 于 击 中 击 不 中 变 
换 ， 有 具体 参见 11.3.1 小 节 。 


小 技巧 : БА ЗЕК RADE 
中 心 ) AWIR 


无 论 是 函数 Erode( ) 还 是 MATLAB 
的 IPT 疯 数 imerode( )， 均 没有 提供 为 结 
构 元 双人 设 定 原 后 的 功能 ， 原 扣 忆 是 侯 
认为 位 于 点 
( Llwidth(se) + 1)/2] .Lfheignt(se)+112] ) 处 ,其 中 
widht (se ) 和 height (se ) 分 别 表 示 结 构 
元 系 se 的 宽度 和 高 度 。 上 面 的 调用 方 
式 通过 在 有 意义 的 se 周围 填充 -1 的 方 
法 来 改变 se KREMA, AEI 
点 ( L(width{se)+1)/2]. Laeiontsej+12) BL 2E EE 


Ее 


利用 这 个 小 技巧 ， 算 法 Erode( ) 可 以 计算 不 大 
于 3x3 的 任意 形状 的 еке; 如 使 用 图 
11.5 中 那 种 2x2 的 非 对 称 结构 元 系 ， 只 需 按 照 如 下 
方式 设置 SE 并 调用 Erode( ) 方 法 。 


int se[3][3] = 441-1, 1, -1}, {1, 1}, {-1 1}}; 
CImgProcess imgOutput = imgInput; ара х 


时 输出 图 像 
imgInput.Erode(&imgOutput, se); // ЖШ 





рй Н] AA H БН B ҮЛ 6 pt rH ij s Г.Ж 
М ae b 11.5) his Pr, SZ 45 | I 4 
11.5 (b) AHER. 


11.22 КЛ. 
1. 理论 基础 


对 Z“ 上 元 素 的 集合 A 和 S ， 使 用 S 对 A 进行 膨 
胀 ， 记 作 AsSs ， 形 式 化 地 定义 为 : 


Ae S= (8). Пля р 


(11-2) 


KEA А ЕЕ ОЯЛА НУ л 245 ， 让 5 


在 整个 Z? 平 面 上 移动 ， 当 其 自身 原点 平移 至 z 点 
时 ，S 相对 于 其 自身 的 原点 的 映像 3 和 A 有 公共 的 交 
集 ， 即 5 和 A 至 少 有 1 个 像素 是 重大 的 ， 则 所 有 这 样 
的 z 点 构成 的 集合 为 $ 对 A 的 膨胀 图 像 ， 如 图 11.7 所 
уо 


KERE, КШ ША TEARM ht 
是 彼此 对 偶 O Hy, Вр. 


(11-3) 


d/4 
>” 
^ 
B=B 





- + ` ш 


(a) 集合 (b) 正方 形 结构 (c) 3 对 4 膨胀 后 的 结 采 
ЛЯВ САЕМ) 





4/2 
4/4 7 
Р d 
B=B d/2 
A@B 


d/8 d d/8 
(d) 拉 长 的 矩形 结构 元 素 Ce) H (d) 中 结构 元 素 对 4 膨胀 的 结果 
411.7 Кл K 


СЕ тн РТ REKA 


采用 原点 位 于 中 心 的 3x3 对 称 结构 元 素 的 膨胀 
运算 效 末 模拟 如 岁 11.8 所 示 。 





(a) 原 图 像 4 (b) 结构 元 素 $ (с) A@S 
11.8 МАК ИЛЫ, КАЈА 34 АЈА В ИНЕ ДЕЛЕ 
所 弥合 


这 里 值得 注意 的 是 定义 中 要 求 和 A 有 公共 交集 
的 不 是 结构 元 系 S AR, MESAN RES, DS aqa 
RE? 这 种 形式 似乎 容易 让 读者 回忆 起 卷 积 运算 ， 
而 腐蚀 在 形式 上 则 更 像 相 关 运 算 。 由 于 图 11.8 中 使 
用 的 是 对 称 的 结构 元 素 ， 故 使 用 S 和 ; 的 膨胀 结果 
相同 ， 但 对 于 图 11.9 的 非 对 称 结 构 元 系 的 脱 胀 示 
例 ， 则 会 产生 完全 不 同 的 结果 ， 因 此 在 实现 膨胀 运 
锭 时 一 定 要 先 计 算 s 。 





(a) 原 图 像 4 (b) 非 对 称 结构 元 素 9 (с) Š (d) A®S 


411.9 ЗРК Ул ЛИНК 


2. MATLAB 实 现 


Imdilate() 函 数 用 于 完成 图 像 脱 上 胀 ， 其 常用 调用 
形式 如 下 。 


参数 说 明 : 
。 林 为 原始 图 像 ， 可 以 是 二 值 或 灰 度 图 像 ( 对 应 于 
ХРИ ; 
° SE х= Hstrel0 KOR |H] t] Н хе Y nku АЈА Ул 
ЖМ Ж o 
返回 值 : 


。 了 2 为 脱 胀 后 的 输出 图 像 。 


膀 胀 的 作用 : ЈН с, IAK ВЕЛ О ЛТ 
J №, ЖИЛ Кн S RREA A Ju == JJ 
WAR. EIKE H ТЖ ЕП ЧН И KI ЖЕЛ — 
物体 桥接 起 来 ， 对 图 像 进 行 二 值 化 之 后 ， 很 容易 使 
得 一 个 连 退 的 物体 断 农 为 两 个 部 分 ， 和 而 这 会 给 后 续 
的 图 像 分 析 如 要 基于 连通 区 域 的 分 析 统 计 物 体 的 
ш да БИЙ, ШЕЙН] {ГОД IK rk ТНА 
Ёё 


[11.2] 形态 学 腐蚀 和 膨胀 的 应 用 一 一 文字 
т =) М3. 


相应 的 程序 如 下 。 


>> I = imread('starcraft.bmp'); ЛЕ 

>> figure, imshow(I); % 得 到 图 11.16(a) 

>> Те1 = imerode(I, [1 1 1; 1 1 1; 1 1 1]) ; %3x3 下 方形 
ZH J лж BJ JS ҮЙ 

>> figure, imshow(Ie1); % 得 到 图 11.16(b) 

>> Іе2 = imerode(Ie1, [0 1 0; 1 1 1; 0 1 0]); %3x3 十 字 
J ZJ лоя HJ J VB 

>> figure, imshow(Ie2); % 得 到 图 11.16(c) 

>> Id1 = imdilate(Ie2, [1 1 1; 1 1 1; 1 1 1]); %x3 正 方 
J ZR ло ҤЕ ЛЕ 

>> figure, imshow(Id1); % 得 到 图 11.16(d) 

>> Id2 = imdilate(Id1, [1 1 1; 1 1 1; 1 1 1]); %3x3 正 方 
J ZR eJ ло ж ҤЕ ЛЕ 

>> figure, imshow(Id2); % 得 到 图 11.16(e) 

>> Id3 = imdilate(Id2, [0 1 90; 1 1 1; 01 0]); 

>> figure, imshow(Id3); % 得 到 图 11.16(f) %3x3 十 字形 结构 元 
A HEK 


НА 
上 述 程序 的 运行 结果 如 图 11.10 所 示 。 


Starcraft 10 Years КЕТО 





(а) 原始 图 像 starcraft.bmp (b) 图 (a) 经 过 3x3 正 方形 结构 元 素 腐 蚀 


Starcraft 10 Years W Starcraft 10 Years 





(c) В (b) 经 过 3x3 十 字形 结构 元 素 腐 蚀 (d) E| (c) 经 过 3x3 正 方形 结构 元 素 膨胀 


Starcraft 10 Үеагѕ Й Ѕіагсгай 10 Years 





(e) В (d) 经 3x3 正 方形 结构 元 素 膨 胀 (f) E| Се? 经 3x3 十 字形 结构 元 素 膨 胀 


411.10 КИ 
3. Visual C++ 实现 


Visual C++ 可 实现 不 大 于 3x3 的 任意 形状 的 结构 
元 素 的 脱 胀 算法 ，DilateO0 函 数 的 实现 细节 如 下 。 





k Kiki ЕКЕ КЕЗЕ 


void CImgProcess::Dilate(CImgProcess* pTo, int se[3][3] 


) 
功能 : 3*З^ Ул ж) B PA b Kas 5 
注 : 只 能 处 理 2 值 图 象 
参数 :  Image* pTo: 目标 和 输出 网 像 的 CImgProcess 指针 
se[3] [3]: 3*3 的 结构 元 系 ， 其 数组 元 系 的 合法 取 值 为 : 
1 --- 前 景 


-1 --- 不 关心 


BEA: Ж 


ЕЛЕ КЕЕ ЗЕ ЕКЕ ЖЕКЕЧЕ / 


void CImgProcess::Dilate(CImgProcess *pTo, int se[3][3] 


) 
l 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


int i, j; // 图 像 循环 变量 
int k, 1; // 结 构 元 素 循 坏 变 量 


// 计 算 se 关 于 中 心 的 对 称 集 
int nTmp; 
for(i=0; 1<2; i++) 
for(j=0; j<3-i; j++) 
nTmp = <е[1][7]; 


se[i][j] = se[2-i][2-j]; 
se[2-i][2-j] = nTmp; 


} 

pTo->InitPixels(255); // 清 空 日 标 输 出 图 像 

// 逮 行 扫 插 图 像 ， 为 防止 访问 越 罕 ， 四 周 留 出 一 个 像 系 筑 的 空 边 
for(i=1; i<nHeight-1; i++) 

| for(j=1; j<nWidth-1; j++) 


l 
// 由 于 便 用 的 是 3*3 的 结构 元 系 ， 为 防止 越界 ， 不 处 理 最 上 和 荫 


下 的 两 行 像 系 以 及 最 左 和 最 右 的 两 列 像 系 


for(k=0; k<3; k++) 
l 


for(1l=0; 1<3; 1++) 


{ 
if( se[k][1] = = -1 ) // 不 关心 


continue; 
if( se[k][1] = = 1 ) 
{ 
if( GetGray(j-1+1, 1-1+к) = = Ө) 


l 
// J УТУ EJ лж НА А SA 771, Ж НЧИ 
应 于 结构 元 系 中 心 的 像素 置 6 
pTo->SetPixel(j, i, RGB(0, Ө, Ө) 
); 


break; 


} 
} 


else 


AfxMessageBox(" 结 构 元 素 含 有 非法 值 ! 
请 检查 后 重新 设 定 。"); 
return; 


) 


}//for 1 
}//for k 


y// for j 
}// for i 


利用 Dilate( ) р Z SE: Jl КИ ¿JK HJ ye 2542] 48 
HA ⁄EDIPDemo TFE F WALAI A 2rvoid 


CDIPDemoView::OnMorphDilation0 中 ， 其 中 调用 
Dilate() 国 数 的 代码 片 断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 Dilate( ) sJ КЧ ЛИЛЕ 
imgInput.Dilate(&imgOutput, se); 
//se 为 代表 结构 元 素 的 3*3 整 形 数组 ， 根 据 用 户 输 入 指定 。 默 认为 3*3 


的 方形 结构 元 系 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设置 
结构 元 勾 。 旋 者 可 以 通过 交 盘 中 示例 程 序 DIPDemo 
中 的 这 单 命令 “形态 学 变换 ”膨胀 ?来 观察 处 理 效 
Ж. 


11.2.3” 开 运算 及 其 实现 

开 运 算 和 闭 运 算 都 由 腐蚀 和 膨胀 复合 而 成 ， 开 
运算 是 先 腐蚀 后 脖 胀 ， 而 财运 算是 先 膨 胀 后 腐蚀 。 
下 面 先 介绍 开 运 算 ，11.2.4 小 节 介 绍 闭 运算 。 
1. 理论 基础 


使 用 结构 元 系 S 对 A 进行 开 和 运算 ， 记 作 A.s ， 可 


表示 为 : 
A.S=(AeS)e S 
(11-4) 


一 般 来 该 ， 开 运算 使 图 像 的 轮廓 变 得 光 请 ， 断 
开 狭 罕 的 连 授 和 消除 细毛 刺 。 


如 图 11.11 所 示 ， 开 运算 断 开 了 图 中 两 个 小 区 域 
辣 两 个 像素 宽 的 连接 WF TEER) , РН 
除了 右 侧 物体 上 部 突出 的 一 个 小 于 结构 元 素 的 2x。 
的 区 域 (去 除 细小 毛刺 ，; {НЕ ИШИМ е, B 
像 大 的 轮廓 并 没有 发 生 整 体 的 收缩 ， 物 体位 置 也 没 
有 发 生 任何 变化 。 





(a) 原 图 像 4 (b) 结构 元 系 S (с) AoS 
411.11 Жая АИ 
根据 图 11.12 的 开 运 算 示 意图 ， 可 以 帮助 读者 更 


好 地 理解 开 运 算 的 特点 ， 为 了 比较 ， 图 中 也 标示 出 
了 相应 的 腐蚀 运算 的 结 琳 。 


AəsS= U í (S), 105), C 4} 


人 À 


(a) 结构 元 素 $ 紧 (b) 结构 元 素 S (c) 4 中 的 圆 角 三 角形 轮 (d) 阴影 区 域 是 开 运 算 的 结 末 
贴 4 的 内 边界 滨 动 廓 是 开 运 算 的 外 部 边界 





411.12 Жайка RK 


ТЕ 411.129, Е2 лж AIA 的 内 边界 深 
动 ， 深 动 过 程 中 始终 保证 S 完全 包含 于 A ， 此 时 5$ 
中 的 点 所 能 达到 的 最 靠近 A 的 内 边界 的 位 置 束 构成 
了 图 11.12 (с) 所 示 的 开 i енп А 从 这 个 意 
义 上 开 运 算 可 以 表示 为 : 4ss=utlsj:l(s9s4 。 而 此 时 
S 的 中 心 所 能 达到 К ЗА 的 内 这 力克 的 位 置 就 构 
RTS 对 A 的 必 刨 的 外 边界 〈 见 图 11.12 (а) 中 的 
虚线 轮廓 〉。 


2. MATLAB 实 现 


根据 定义 ， 以 相同 的 结构 元 素 乞 后 调用 
imerode0 和 imdilateO 即 可 实现 开 操作 。 此 外 ， 
MATLAB 中 也 百 接 提供 了 开 运 算 函 数 imopenO0， 其 
调用 形式 如 下 。 


I2 = imopen(I, SE); 


参数 说 明 : 


° 为 原始 图 像 ， 可 以 是 二 值 或 灰 度 图 像 〈 对 应 于 
KEF) ; 

° SF 是 由 strel0 函 数 返 回 的 目 定 义 或 预 设 的 结构 元 
系 对 象 。 


返回 值 : 
。12 为 开 运 算 后 的 输出 图 像 。 


利用 imopen() 对 例 11.1 1 中 Н ЧИ 
erode_dilate.bmp 进 行 开 运算 的 MATLAB 程 序 如 下 。 


>> І = Imread(' erode dilate.bmp ) ; 
>> figure, imshow(I, []); % л &11.13(а) 
>> Іо = imopen(I, ones(6, 6)); % 采用 6*6 的 正方 形 结构 元 素 


开 运 算 
>> figure, imshow(Io, []); % 175 11.13(60) 





上 述 程 序 运 行 后 效 末 如 图 11.13 所 示 。 





(a) erode dilate.bmp (b) (a) 的 开 运 算 结 果 
图 11.13” 开 运算 结 末 


从 图 11.13 中 可 以 看 到 ， 同 腐蚀 相 比 ， 开 运算 在 
过 小 噪声 的 同时 并 没有 对 物体 的 形状 、 轩 廓 造成 明 
显 的 影响 ， 这 是 一 大 优势 。 但 当 读 者 只 关心 物体 的 
位 置 或 者 个 数 时 ， 物 体形 状 的 改变 不 会 给 读者 市 来 
Ш, ERTH Е А КЖ БЕ ЕНЕ З СТЫ] 
MERIETE Г ККА r) 。 


3. Visual C++ 实现 


А] Н Visual C++ 实 现 二 值 图 像 开 运算 的 代 人 如 
下 所 示 。 





S а ENEE TUTUP 


void CImgProcess::Open(CImgProcess* pTo, int se[3][3]) 

功能 : ”3*3 绍 构 元 系 的 二 值 图 像 开 运算 

注 : 只 能 处 理 值 图 象 

参数 : 1таре* pTo: 目标 输出 网 像 的 CImgProcess 指针 
se[3][3]: 3*3 的 结构 元 篆 ， 其 数组 元 系 的 合法 取 值 为 : 


1 --- 前 景 
-1 Е 不 关心 
返回 值 ， 无 


i Е / 
void CImgProcess::Open(CImgProcess* pTo, int se[3][3]) 
{ 


pTo->InitPixels(255); 
Erode(pTo, se); 


CImgProcess tmpImg = *pTo; 


tmpImg.Dilate(pTo, se); 


利用 Open( R 912722 I së 22 5415145 
+] Ж EDIPDemo Т. rH АЈА 2 pR %tvoid 
CDIPDemoView::OnMorphOpen() 中 ， 其 中 调用 
Ореп() р 119 А Т F ETR o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 0pen() 实 现 图 像 开 
imgInput.Open (&imgOutput, se); 


//se 为 代表 结构 元 素 的 3*3 整 形 数组 ， 根 据 用 户 输入 指定 。 默 认为 3# 
3 的 方形 结构 元 素 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 上述 程序 运行 时 会 弹出 对 话 和 框 ， 要 求 用 户 设 置 
结 爸 元 系 。 谈 痢 可 以 通过 光盘 中 示例 程序 DIPDemo 
PREMS ESFE > Илл И” ЖАЙ Ж АБИ 
Ж. 


11.24 ” 闭 运 算 及 其 实现 
1. 理论 基础 


使 用 结构 元 系 S 对 A 进行 财运 算 ， 记 作 A :S ， 
可 表示 为 : 


A.S=(AsS)eS 
(11-5) 


лес, е 
Б, "ЕЛЕ ВЕН УК ТҮЛКЕ Juj, HAL] 


Е py i 411.809 И ИЕ ЙУН), К 11.1415 
的 闭 运 算 在 前 景物 体 整 体位 置 和 轮廓 不 变 的 ”情况 
К, BRE К АЈ ВРА РЗА ВЈ. 


|||! үү 
ЖЕШ иш w ma 
иип иш | | 
|| үү 
ПШШИИИ ИИИ ЕИ И mi 
(а) 原 图 像 4 (b) 结构 元 素 $ (c) AeS 





411.14 ” 闭 运算 效果 模拟 


根据 图 11.15 的 闭 运 算 示 意图 ， 可 以 帮助 读者 更 
好 地 理解 闭 运 算 的 特点 ， 为 了 比较 ， 图 中 也 给 出 了 


相应 的 脱 胀 运算 的 结 
| 


(а) Жул SA ш (b) 闭 和 运算 的 外 部 边界 〈c) 阴影 区 域 是 闭 运 算 的 结果 
集合 4 的 外 边界 深 动 





411.15 а RK 


Као 5 ЛНА НУМО Я 5), RA 
过 程 中 始终 你 证 $ 不 完全 离开 A (5). пло) ， 此 时 
S 中 的 后 所 能 达到 的 最 徘 近 A ШУК ЯНАУЛ Е 


рК T 11.15 (b) 所 示 的 财运 算 的 外 边界 。 而 此 时 5$ 
中 心 点 所 能 达到 的 最 靠近 A 的 内 边界 的 位 置 就 构成 
k F ШШ ЖОШ УЛ я СА 411.15 (а) 中 的 虐 
ZE е О 。 


从 图 11.12 和 图 11.15 中 ， 可 以 注意 到 ， 在 圆 形 
的 结构 元 素 作 用 下 ， 开 运算 使 得 物体 小 于 180?* 的 扫 
角 变 得 圆 消 ， 大 于 180° 的 角 则 没有 变化 ， 腐 蚀 运 算 
5 я Б: 而 财运 算 使 得 物体 大 于 180。 
的 拐角 变 得 圆滑 ， 而 小 于 180?* 的 拐角 则 没有 变化 ， 
Eike A UK- ARA o 


Bi та e WA AEA ERBER, AA 
Im J MARAE ХУ 126 RAHA 
或 财运 算 和 只 进行 一 次 运算 的 效 来 相同 ， 即 有 : 
(Ао Blo B= AoB., (Ае Вә B= AB 
(11-6) 
2. MATLAB 实 现 


根据 定义 ， 以 相同 的 结构 元 系 乞 后 调用 
imdilate() 和 imerode() 即 可 实现 团 操 作 。 此 外 ， 
MATLAB 中 也 直接 提供 了 闭 运算 函数 imclose()， 其 
用 法 同 imopenO 类 似 ， 这 里 不 再 蒙 述 。 


3. Visual C++ 实现 


利用 Visual С++5Е 48 BNA 2 УН ЖТ 
BHH F. 


EDT TT 


void CImgProcess::Close(CImgProcess* pTo, int se[3][3]) 
3*3 结 构 元 素 的 二 值 图 像 闭 运算 
只 能 处 理 值 图 象 
Image* pTo: 目标 输出 图 像 的 CImgProcess 指针 
se[3] [3]: 3*3 的 结构 元 系 ， 其 数组 元 系 的 合法 取 值 为 : 
1 --- В 
-1 --- 不 关心 
BREE: 无 


下 


void CImgProcess::Close(CImgProcess* pTo, int se[3][3]) 
l 


pTo->InitPixels(255); 
Dilate(pTo, se); 
CImgProcess tmplImg = *pTo; 


tmpImg.Erode(pTo, se); 





А СІоѕе() РА 2551 ENR ИЛ SL НУ ус 3 л 04 
ДЫ] Ж ТЕЮШРО ето l P ВА 2 р 25rvoid 
CDIPDemoView::OnMorphClose0 中 ， 其 中 调用 
Close( ) A ZJARA ТИП F PH ZF 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 Close() 实 现 图 像 闭 
imgInput.Close(&imgOutput, se); 

//se 为 代表 结构 元 素 的 3*3 整 形 数组 ， 根 据 用 户 输入 指定 。 默 认为 3# 
3 的 方形 结构 元 素 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设置 
结构 元 勾 。 旋 者 可 以 通过 交 盘 中 示例 程序 DIPDemo 
中 的 这 单 命令 “形态 学 变换 ”财运 算 ? 来 观察 处 理 效 
Ж. 


113 ЕНЕЛ 


本 节 将 介绍 一 些 非常 经 典 的 形态 学 应 用 ， 它 们 
都 是 通过 将 11.2 节 中 的 基本 运算 按照 特定 次 序 组 合 
起 来 ， 并 且 采 用 一 些 特殊 的 结构 元 素 而 实现 的 。 


11.3.1 小 节 将 要 介绍 的 击 中 击 不 中 和 变换， 主要 
用 于 图 像 中 某 种 特定 形状 的 精确 定位 ， 其 后 将 要 讨 
论 的 很 多 形态 学 应 用 ， 如 轮廓 、 细 化 以 及 像素 化 等 
都 有 助 于 使 用 者 抓 住 物体 最 本 质 的 特征 (轮廓 、 形 
状 或 位 置 ) ， 这 些 特征 都 是 强 有 力 的 图 像 摘 绘 子 ， 


经 处 理 后 可 作为 后 续 的 识别 任务 所 需要 的 特征 。 
11.3.1 击 中 与 击 不 中 变换 及 其 实现 
1. 理论 基础 


形态 学 击 中 击 不 中 变换 篆 用 于 图 像 中 茶 种 特定 
形状 的 精确 定位 ， 和 是 一 种 形状 检 剖 的 基本 工具 。 记 
作 A @S ， 可 表示 为 : 


AeS=(AeS1)n(ASə 5 2) 
(11-7) 


Жн, 9192-6 Н-1052, ЗЕ ЕЗ 1 代表 S 中 
读者 感 兴趣 的 物体 〈 要 检测 的 形状 ) 对 应 的 集合 ， 
HIS 2205 中 背景 部 分 对 应 的 集合 。 


AR 11-7) 上 分 析 ， 击 中 击 不 中 变换 首先 用 
读者 感 兴趣 的 物体 S 1 去 岳 蚀 图 像 A ， 得 到 的 结果 是 
ES 1 完全 包含 于 A 中， 前景 部 分 是 其 中 心 点 位 置 的 
集合 U1， 可 以 将 U1 看 作 是 S$ 1 在 A 中 所 有 匹配 的 中 
心 点 的 集合 。 为 了 在 A 中 精确 地 定位 S$ 1 而 排除 挥 那 
些 仅仅 包含 S 1 但 不 同 于 S 1 的 物体 或 区 域 ， 有 必要 
引入 和 S 1 相关 的 背景 部 分 S 2， 一 般 来 说 S 2 是 在 S 1 
周围 包 络 看 S 187 007, 5 1 和 S 2 和 在 一 起 组 成 


YS, K (11-7) 中 的 后 一 半 正 是 计算 图 像 A WJ PS 
景 4 和 S 的 背景 部 分 S$ 2 的 腐蚀 ， 得 到 的 结果 U 2 是 
使 $ 的 背景 部 分 $ 2 完全 包含 于 4 时 S 中 心 位 置 的 集 
合 。U1 和 U 2 的 交集 自然 束 是 这 样 一 些 点 p 的 集 
合 : 245 中 心 位 于 p 时 ，S 的 前 景 (物体 〉 部 分 S1 
和 A 中 的 茶 个 前 景 部 分 完全 重合 ， 而 S 的 背景 部 分 
也 和 A 的 茶 个 背景 部 分 完全 重合 ， 而 $ 1 又 是 包 络 
5 2 其 中 的 ， 从 而 保证 了 读者 感 兴趣 的 物体 S 1 在 
图 像 A 的 p HARIRI 7 ЕЕ ДО. A 
合 例 11.3 体 会 击 中 击 不 中 变换 的 原理 。 


【 例 11.3】 击 中 击 不 中 变换 实例 。 


下 面 的 程序 首先 生成 了 一 个 如 图 11.16 (a) 所 
示 的 原始 图 像 ， 其 中 最 左 侧 为 一 |`70 x 60 HJ kE JE JJ 
ЖХ, аа КЕЈ “ох 0 的 正方 形 Y， 右 上 方 
的 正方 形 Z 的 边 长 为 30， 而 后 生成 了 如 图 
11.16 СЪ) 所 示 的 结构 元 系 S 和 物体 S$ 1; 接 下 来 ， 
程序 根据 式 (11-7) 计算 I 与 $ 的 击 中 击 不 中 变换 Je 
$, 





>> % 生成 原始 图 像 

>> Т = zeros(120, 180); 

>> 1(11:80, 16:75) = 1; 

>> 1(56:105, 86:135) = 1; 

>> I(26:55, 141:170) = 1; 

>> figure, imshow(I); % 得 到 图 11.16(a) 
>> 


>> % 生成 结构 元 素 S 

>> se = zeros(58, 58); 

>> se(5:54, 5:54) = 1; % 物体 S1 

>> figure, imshow(se); % 得 到 图 11.16(b) 
>> 

>> % 击 中 击 不 中 变换 

>> Те1 = imerode(I, se); % ИЖ 

>> figure, ітѕһом(Іе1); % 得 到 图 11.16(c) 
>> Іс = 1-1; % I 的 补 

>> figure, imshow(Ic); % 得 到 图 11.16(d) 
>> 52 = 1-se; 

>> figure, imshow(S2); % 得 到 图 11.16(e) 
>> Те2 = imerode(Ic, S2); % BRAW % 得 到 图 11.16(f) 
>> Ihm = Iel & Ie2; % 两 次 腐蚀 的 交集 

>> figure, imshow(Ihm); % 得 到 图 11.16(g) 


上 述 程序 的 运行 结 示 如 图 11.16 所 示 。 


Е: 11.16 (g) 给 出 了 要 换 的 最 终结 来。 为 
便于 观察， 在 喧 示 时 每 幅 图 像 周 围 部 环绕 看 一 圈 黑 
色 边 框 ， 注 意 访 边框 并 不 是 图 像 本 号 的 一 部 分 。 


ww 
注意 


对 于 结构 元 素 $ ， 读 者 感 兴 趣 的 物体 S 1 之 外 的 背景 S 2 不 能 选择 得 
太 宽 ， 因 为 使 得 9 BE BERS 2 的 目的 仅仅 是 定义 出 物体 S 1 的 外 轮 亡 ， 
以 便 在 图 像 中 能 够 找到 准确 的 完全 匹配 位 置 。 从 这 个 意义 上 说 ， 物 体 $ 
1 周围 有 一 个 像 系 宽 的 育 景 环 纪 融 足够 了 ， 例 11.3 中 选择 / 47" Z м. 
的 背景 ， 征 为 了 使 结构 元 系 育 景 部 分 $ 2 看 起 来 比较 明 巡 ， 但 如 打 育 景 
部 分 过 大 ， 则 会 影 啊 击 中 击 不 中 变换 的 计算 结 朱 ， 在 上 例 中 中 间 的 正 
方形 了 与 右上 的 正方 形 Z 之 则 的 水 平 距离 为 6， 如 末 在 定义 S 时 ，3S 2 的 
览 度 超过 6 个 像 系 ， 则 了 最 终 的 计算 结束 将 是 空 集 。 





п ЩЩ 8." 


(а) 原始 图 像 (b) S (白色 部 分 为 物体 S1) (с) JOSI (d) (а) 的 补 集 Ie 
(e) S° (日 色 部 分 为 背景 32) (f) FOS2 (g) 最 终 的 匹配 位 置 是 图 (ec) 和 图 Cf) 的 交集 


411.16 ” 击 中 击 不 中 变换 
根据 式 (11-3) 给 出 的 对 侦 关 系 ， 式 (11-7) 
还 可 表示 为 如 下 两 种 形式 ， 因 而 ， 式 (11-7)〉 更 为 
АХ, н. 
Ae S= (Дө5 1) nss) 
= (A ə 5 1)-(4 82) 
(11-8) 
2. MATLAB 实 现 


IPT 中 进行 击 中 击 不 中 变换 的 图 效 为 
bwhitmiss()， 调 用 形式 如 下 。 


Ihm = bwhitmiss(1, 51, S2); 


参数 说 明 : 


° 为 输入 图 像 
• < 1 和 5S 2 即 为 式 〈11-7) 中 介绍 过 的 结构 元 素 。 


返回 值 : 
° Ihm 是 击 中 击 个 中 变换 后 的 结 来 图 像 。 


如 和 使 用 bwhitmissO0 函 数 来 完成 例 11.3， 则 只 
项 下 面 的 一 名 代码。 





3. Visual C++ 实现 


在 11.2.1 小 季 中 介绍 腐蚀 的 Visual C++ 实现 时 ， 
已 经 提 到 了 当 结 构 元 系 中 包含 0 时 ，Erode( ) 算 法 将 
具有 模板 匹配 的 功能 ， 可 直接 用 于 实现 击 中 击 不 中 
变换 。 此 时 只 有 在 结构 元 素 SE 中 为 1 的 元 素 下 面 的 
像素 为 0〈 图 像 中 的 前 景 黑 色 ) ， 同 时 SE 中 为 0 的 
元 素 下 面 的 像素 为 255〈 图 像 中 的 背景 白色 ) 的 情 
况 下 才 形 成 一 个 匹配 ， 而 SE 中 为 -1 的 元 素 下 面 的 像 
素 不 关心 ， 为 0 或 255 均 可 。 


为 了 实现 标准 的 击 中 击 不 中 变换 ， 只 需要 如 下 
W E Zi JJ = SE 并 调用 函数 Erode( ): ТЕЙ EB JL Bu 
НУЛИ л EE] jl E- AEREN A ВЈ R, 
即 在 模板 SE 中 ， 用 1 表示 物体 ， 周 围 加 上 至 少 一 个 
像素 宽 的 0 即 可 。 


11.3.2 边界 提取 与 跟踪 及 其 实现 


轮廓 是 对 物体 形状 的 有 力 揪 述 ， 对 于 图 像 分 
析 和 识别 十 分 有 用 。 通 过 边 寞 所 取 算 法 可 以 得 到 物 
体 的 边界 轮廓 ;而 边界 跟踪 算法 在 提取 边界 的 同时 
还 能 依次 记录 下 边界 像 了 系 的 位 置信 息 ， 下 面 分 别 介 


ZH. 
1. 边界 提取 


要 在 二 值 图 像 中 提取 物体 的 边 者 ， 容 易 想 到 的 
一 个 万 法 是 将 所 有 有 物体 内 部 的 把 删 除 〈 半 为 痛 景 
E) 。 具 体 地 说 ， 可 以 逐 行 扫 插 原 图 像 ， 如 果 友 现 


是 黑 点 ， 则 该 点 为 内 部 点 ， 在 目标 图 像 中 将 它 删 
除 。 实 际 上 这 相当 于 采用 一 个 3x3 的 结构 元 素 对 原 


内 部 点 外 保留 ， 再 用 原 图 像 减 去 腐蚀 后 的 图 像 ， 恰 
好 删 际 了 这 些 内 部 点 ， 留 下 了 边界 像 系 。 这 一 过 程 
可 如 图 11.17 所 示 。 





(а) 原 图 像 4 (b) 腐蚀 的 结构 (c) 4 被 S 腐蚀 后 (d) HAREK (c) 中 腐蚀 图 像 
元 素 S 得 到 的 边界 图 像 ， 在 图 中 贯穿 像素 
中 心 的 一 条 黑色 线 标 出 了 1 个 像素 

宽 的 边界 


图 11.17 边界 提取 
[111.4] 边界 轮廓 提取 。 


ЖАВАД ИА ЛВ ЕНА) 
MATLAB 程 序 如 下 。 


I = imread('head portrait.bmp'); % 读 入 原 图 像 


figure, imshow(I); % 得 到 图 11.18(a) 中 的 图 像 
se = strel('square', 3); %3*3 的 正方 形 结构 元 素 


Те = imerode(I, se); % 腐 蚀 得 到 内 部 点 
Iout = І - Те; % 减 去 内 部 扣留 下 边界 所 
figure, imshow(Iout); % 得 到 图 11.18(b) 中 的 图 像 





偿 程 序 的 运行 结 未 如 图 11.18 所 示 。 





(а) 侧面 轮廓 的 二 值 化 图 像 head_portraitbmp (b) 采用 上 述 方法 边界 提取 后 图 像 
411.18 边界 轮 万 提取 
2. 边界 跟踪 


为 了 依次 记录 下 边界 上 的 各 个 像 系 ， 边 寞 跟踪 
首 爷 按照 未 种 扫 拉 规则 找到 目标 物体 按 完 上 的 一 个 
BAR. MEN NZR NEUR R IRIART 
СД ТНУ КЛОНУ) 依次 找 出 物体 边界 上 的 其 余 
Жж, НАЈ] y ERK ЗЛА ЯН 


з» 
EF о 


例如 ， 可 以 按照 从 左 到 右 、 从 上 到 下 的 顺序 扫 
摘 图 像 ， 这 样 首 先 会 找到 目标 物体 最 左上 方 的 边 寞 
点 P0， 显 然 ， 这 个 点 的 左 侧 以 及 上 侧 都 不 可 能 存 
在 边界 点 《否则 左 侧 或 者 上 侧 的 边界 点 融会 成 为 第 
一 个 被 扫描 到 的 边界 点 ) ， 因 此 不 妨 从 左下 方向 道 
时 针 开 始 探 查 ， 如 左下 方 的 点 是 黑 点 ， 下 接 跟 踪 至 
KIFFA, ТҮЛКЕ Л EIE IEF., HEIR 


Да, ЕКА JJ у BJ ЖЕШ ЕЛДИ Г 1819290°, 2% 

kH ЕКЕЖ Ж POTDAR EIRA УХ] 
ФАА 22 Ят КАР 0， 完 成 了 整 条 边界 的 跟踪 。 整 个 

跟踪 过 程 如 图 11.19 所 示 。 





411.19 ”轮廓 跟踪 算法 示意 


З. AERE AYA M Visual C++ 实现 


利用 Visual C+E ELIZ A ER Ea А AJAH RARIS 
И | 


лкт ЕЕ ЕЕЕ КЕРЕБЕТ ЕЕЕ 


void CImgProcess::TraceBoundary(CGray* pTo) 
功能 : ERMEER rH У ЈИ НУ Л 
注 : 只 能 处 理 2 值 图 象 

参数 : ”CGray* pTo: 目标 输出 图 像 的 CGray 指针 
返回 值 ， Ж 


下 


void CImgProcess: :TraceBoundary(CImgProcess *pTo) 


{ 
pTo->InitPixels(255);// 清 空 日 标 图 像 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


/ ААР 
int 1; 
int j; 


/ [ERRA s LJ 23 I| 12 F SA 
POINT ptStart; 
POINT ptCur; 


ГЎЛУ Н, {Ж F, F, ЖЕ, # AE, LE, ЖЕ, Z) 

int Direction[8][2]=( {-1,1}, {0,1}, {1,1}, {1,0}, 
{1,-1}, {0,-1}, ==» {1-1,0} J; 

int BeginDirect; 

int nCurDirect = Ө; // 当 前 探查 方 同 

int xPos; 

int yPos; 


bool bAtStartPt; //Жу©гие хл ЕН ҤЕ, J 7 Xap 
tCur = = ptStart 的 两 种 情况 (一 种 开始 ， 一 种 结束 ) 


// 拭 法 不 处 理 边 界 上 的 操 ， 将 图 像 的 四 周 的 一 阐 边界 鉴 白 


for(i=0; i<nHeight; i++) 


SetPixel(90, i, RGB(255, 255, 255)); 
SetPixel(nWidth-1, i, RGB(255, 255, 255)); 


J 
for(j=0; j<nWidth; j++) 
{ 
SetPixel(j, 0, RGB(255, 255, 255)); 
SetPixel(j, nHeight-1, RGB(255, 255, 255)); 
J 
// 逐 行 扫 搞 
for(i=0; i<nHeight; i++) 
l 
for(j=0; j<nWidth; j++) 
{ 
if(GetGray(j, i) = = 6)// 找 到 最 左上 的 第 一 个 边界 点 
l 
ptStart.x = j; 
ptStart.y = i; 
ptCur = ptStart; 
bAtStartPt = true; 
while( ( (ptCur.x != ptStart.x) || (ptCur.y 
I= ptStart.y) ) || bAtStartPt ) 


bAtStartPt = false; 


// 下 一 个 探查 位 置 
xPos = ptCur.x + Direction|nCurbDirect][0]; 
yPos = ptCur.y + Direction[|nCurDirect][1]; 
int nSearchTimes = 1; 
while( GetGray(xPos, yPos) = = 255 ) 
{ 
nCurDirect ++; //ЛЕ ЕЛЕ 45 FE 
if(nCurDirect >= 8) 


nCurDirect -= 8; 


xPos = ptCur.x + Direction|nCurDirect][|[ 


0]; 


yPos = ptCur.y + Direction|nCurbDirect]|[ 


1]; 


if( ++nSearchTimes >= 8 ) //8©1 F ERA 
ЛЗ КА, WEI 

l 

xPos = ptCur.x; 

yPos = ptCur.y; 

һгеаК; 

J 

J 


ЕЕЕ 

ptCur.x = xPos; 

ptCur.y = yPos; 

pTo->SetPixel(ptCur.x, ptCur.y, RGB(0, е, 
0)); // 在 新 图 像 上 标记 边界 

OS OSO Е 

ТЕЕ >“ JINI, UMR ie WK uo F AJF А 
ptCur 


Topi rn etr 


nCurDirect -= 2; // AMRED PIR Er [Н| #9 
OFEN КИКЛАДА 27 ln] 
if(nCurDirect < 0) 
nCurDirect += 8; 
J 
return; 
}// if 
天 
在 此 处 添加 适当 的 代码 ， 并 去 挥 上 面 的 return 语 句 ， 如 果 需 要 跟踪 图 
像 中 所 有 物体 的 边界 。 


和 


y// for j 
}//for i 


} 





X Е'ТгасеВоџпӣагу() 95, WAV КЛ 
说 明 。 

° 如 末 需 要 在 边 弄 跟踪 过 程 中 依次 记录 下 个 边 寞 
点 的 坐标 信息 ， 可 在 代 人 码 中 的 适当 位 置 ( 见 代 
但 中 注释 ) 将 ptCur 保 存 起 来 ， 如 体 存 到 一 个 
vector 数 组 中 。 

° TraceBoundaryO 只 是 跟踪 了 第 1 个 找到 的 物体 的 
边 乔 ， 即 了 最 左上 方 物体 的 边界 加 返 回 了 。 如 采 
裔 要 跟 路 图像 中 所 有 物体 的 边 卉 ， 可 以 通过 多 
次 调用 TraceBoundary0O 或 下 接收 改 国 数 本 丑 

СЛИКЕ У) ， 每 跟 躁 完 于 一 个 物体 的 边 
FRIZA RE (GA), AAR 
En ABEILA o 

在 已 知 物体 中 的 菜 个 点 的 情况 下 ， 可 以 采用 基于 连通 区 域 的 方法 

清除 该 物体 ， 有 天 连通 区 域 的 知识 将 在 11.3.4 小 节 中 介绍 。 


• TiaceBoundary0O 算 法 只 能 提取 出 物体 的 外 轮 


Б, АТН ЯНУ ЛК, ЖЕРАРД а А. Ў 
ШП) ЕБ: 


利用 TraceBoundary (A 22221220 Я. ER ER M с *e 
JSI 5 Е рІррето T FEF ВЈ 2 рк уота 
CDIPDemoView::OnMorphTrace() 中 ， 其 中 调用 
TraceBoundary() 4 1015 А т Р ТУХ. 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 TraceBoundary() 函 数 实 现 边界 跟踪 


imgInput.TraceBoundary(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “形态 学 变换 边界 跟踪 ”来 观察 处 理 效果 。 


11.3.3 ”区域 填充 及 其 Visual C++ 实现 

区 域 填 充 可 视 为 边界 提取 的 有 反 过 程 ， 它 古 在 边 
界 己 知 的 情况 下 得 到 边界 包围 的 整个 区 域 的 形 态 学 
技术 。 
1. 理论 基础 


问题 的 摘 述 如 下 : 已 知 某 一 8 连通 边界 和 边界 
内 部 的 某 个 点 ， 要 求 从 该 点 开始 填充 整个 边界 包围 
HKE AREER MAT, Ee 
IERI hh Г” 


首先 注意 到 ， 对 于 4 连通 的 边界 ， 其 围 成 的 内 
部 区 域 是 8 连通 的 ， 而 8 连通 的 边界 围 成 的 内 部 区 域 
却 是 4 连通 的 ， 如 图 11.20 所 示 。 





(a) 4 连通 边界 的 8 连通 内 部 区 域 (b) 用 来 填充 4 连通 (c) 8 连通 边界 的 4 连通 内 部 区 域 (d) 用 来 填充 8 连通 
边界 的 3x3 结 构 元 素 边界 的 十 字 结 构 元 素 





s": 


411.20 ЖЮ ЛЛУ [ХБ 


为 了 填充 4 连 角 的 边界 应 选择 图 11.20 (b) 中 的 
3x3 结 构 元 素 ， 而 为 在 8 连通 边界 内 从 种 子 点 得 到 区 
域 ， 可 以 选用 图 11.20 (d) 的 十 字 结 构 元 素 S 对 初 
始 时 仅 为 种 子 点 的 图 像 B 进行 膀 胀 ， 十 字 结 构 元 
RS 能 够 保证 只 要 B 在 边界 A 的 内 部 《不 包括 边界 
KF) ， 每 识 膨 上 胀 都 不 会 产生 按 界 之 外 的 点 〈 新 肛 
胀 出 来 的 点 要 么 在 边界 内 部 ， 要 么 最 多 洛 在 边界 
E) ， 这 样 只 需 把 每 次 月 胀 的 结果 图 像 和 边界 的 补 
RZA 相交 ， 束 能 把 脱 胀 限制 在 边界 内 部 。 随 看 对 


В WJ ABH, B ХХ АЛТАЕ, АЕЛИК А 
与 Ac А КМВ 限制 在 边界 A 的 内 部 ， 这 样 一 直 
到 最 终 B 充满 整个 A 的 内 部 区 域 ， 停止 生长 。 此 时 
的 B 与 A 的 并 集 即 为 最 终 的 区 域 填 充 结果 。 

算法 概要 如 下 。 

JUR M: в = HT A 

l LA: Do Biy = (В; e s)n А“ 


Until Бы == В; 


图 11.21 (а) —[ 1121 G) 形象 地 模拟 了 整 
Лх ЧН. 





s": 


(c) 十 字 结 构 元 素 S 





(d) 初始 种 子 B。 (e) Bo 用 B 膨 胀 1 次 СР Bi=Bo 阁 4 将 膨胀 限制 在 A 之 内 





(j) 最 终 膨胀 结果 B 与 
界 A 的 并 集 BUA 


E 


411.21 区域 填充 效果 模拟 


2. Visual C++ 实现 


利用 Visual C++ 实 现 图 像 填 充 的 相关 代码 如 
下 。 





下 


void CImgProcess::FillRgn(CImgProcess* pTo, POINT ptSta 
rt) 

功能 : ”以 ptStart ENIFA P) , HERETER 

注 : 只 能 处 理 2 值 图 象 ， 边 界 假 定 为 8 连通 ，ptSstart 必 须 在 
原 图 像 *this 的 边界 之 内 


参数 : СІтеРгосеѕѕ* pTo: 目标 输出 图 像 的 CImgProcess ЎН 


针 
POINT ptStart: 种 子 点 坐标 
返回 值 : 无 


ОИЕ ЕТКЕЛ ПЕ ЕЕЕ 


void CImgProcess::FillRgn(CImgProcess *pTo, POINT ptSta 
rt) 


{ 
int se[3][3] Е =; 1, =» 11, 1, 1); Cl 1, =} 
J; // 十 字形 结构 元 系 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


pTo->InitPixels(255); // 清 空 日 标 输 出 图 像 


CImgProcess revImg = (*this); 


revImg = !revImg; // 原 图 像 的 补 ， 用 来 限制 甩 胀 


pTo->SetPixel(ptStart.x, ptStart.y, RGB(0, ©, 0)); 
/ IREM HES RART A 
CImgProcess tmpImg = *pTo; // 暂 存 上 一 次 的 运算 结果 


мһі1е( true ) // 循 环 直 到 图 像 的 受 限 肛 胀 不 再 产生 变换 
{ 
tmpImg.Dilate(pTo, se); //H 5290301 
*pTo = *pTo & пемІте; / / ЖЛ Лу ЕЕН JE q61 Я 
if( *рТо == tmpImg )// 个 再 变化 时 集 止 
break; 


tmpImg = *pTo; 
} 


// 最 终 的 结果 为 受 限 脱 上 胀 结果 与 原始 边界 的 并 集 
*pTo = *pTo | (*this); 


) 





AH FiINRgnO ра 55521 1х PRU 7 Н ЕЖЕ НУ ЛК l| 
IWA 01 рТРрето Г "ЧА AIK K %tvoid 
CDIPDemoView::OnMorphFillRgn() 中 ， 其 中 调用 
FillRgn0 函 数 的 代码 厂 断 如 下 所 示 。 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 需要 根据 实际 情况 设置 种 子 点 的 坐标 ， 这 里 简单 地 取 种 子 点 为 
КЕНЕН Г» 

POINT ptStart; 

ptStart.x = imgInput.GetWidthPixel() / 2; 

ptStart.y = imgInput.GetHeight() / 2; 


// 调用 FillRgn() 函 数 实现 种 子 填充 
imgInput.FillRgn(&imgOutput, ptStart); 
//POINT 型 参数 ptstart 为 种 子 点 ， 可 以 是 区 域 当 中 的 任意 一 点 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 的 运行 结果 如 图 11.22 所 示 ， 读 者 可 以 
通过 光 答 中 示例 程序 DIPDemo 中 的 菜单 命令 “形态 
ЕАР, |х АУК" Р. 


pne 





(a) 原 图 像 head boundary VC.bmp (b) (a) 的 填充 效果 


411.22 ”区 域 种 子 填 充 效 果 (种 子 点 设置 于 图 像 中 心 ) 


11.3.4 连通 分 量 提取 及 其 实现 


连通 分 量 的 概念 在 0.3.1 小 节 中 曾 介 绍 过 。 在 二 
值 图 像 中 提取 连通 分 量 是 许多 目 动 图 像 分 析 应 用 中 
的 核心 任务 。 提 取 连 通 分 量 的 过 程 实际 上 也 是 标注 
连通 分 量 的 过 程 ， 通 党 的 做 法 是 给 原 图 像 中 的 每 个 
连通 区 分 配 一 个 唯一 代表 该 区 域 的 编写 ， 在 输出 图 
像 中 该 连通 区 内 的 所 有 像 系 的 像 系 值 束 冉 值 为 该 区 
域 的 编 亏 ， 将 这 样 的 输出 图 像 称 为 标注 图 像 。 


1. 理论 基础 


这 里 准备 介绍 一 种 是 基于 形态 学 的 朋 胀 操作 的 
提取 连通 分 量 的 方法 ， 妨 一 种 递归 的 方法 将 在 
11.3.6 小 节 的 像素 化 算法 中 给 出 。 以 8 连通 的 情况 为 


例 ， 对 于 图 11.23 (а) 中 内 售 多 个 连 退 分 量 的 图 像 
A ， 从 仅 为 连通 分 量 A 1 内 部 的 某 个 点 的 图 像 B H 
台 ， 不 断 采 用 如 图 11.23 (с) 所 示 的 结构 元 素 S 进 
行 膀 胀 。 由 于 其 他 连通 分 量 与 A1 之 间 人 至 少 有 一 条 1 
个 像素 宽 的 空白 颖 院 〈 见 图 11.23 (а) 中 的 虚 

ZR) ，3x3 的 结构 元 素 保 证 了 只 要 B 在 区 域 A 1 的 内 
部 ， 则 每 次 月 胀 都 不 会 产生 位 于 A 中 其 他 连通 区 域 
ZADA, XFER m HRR K a A R BEAAM SE 
ЯВ А 相交 ， 残 能 把 膨胀 限制 在 A1 内 部 。 随 看 对 
ВЕЧАН, ВЕРКА ТЕ, 18ER а 
与 A 的 交集 义 将 B 限制 在 连通 分 量 A1 的 内 部 ， 直 到 
最 终 B 充满 整个 连通 分 量 A 1， 对 连通 分 量 A 1 的 提 


算法 概要 如 下 。 
WURM: B= 连通 分 量 A 1 中 的 某 个 点 
ТА: ро Bai=(B6SIna4 
Until ва = Bi 
提取 连通 分 量 的 算法 与 区 域 填 充 算 法 十 分 相 
似 ， 只 需 改 变 脱 胀 结构 元 系 〈8 连 通 使 用 3x3 的 正方 


形 结构 元 素 ，4 连 通 使 用 3x3 十 字形 结构 元 素 )， 并 
且 把 每 次 通胀 后 同 Ac 的 交集 改 为 同 A 的 交集 。 


2. MATLAB IN 


ÆMATLABF, EMNE MARENE EAE BJ 
IPT 函数 bwlabel0 实 现 ， 其 调用 语法 如 下 。 


[L пит] = bwlabel(Ibw, conn) 


参数 说 明 : 

° [руу 为 一 幅 输 入 二 值 图 像 ; 

° con 为 可 选 参 数 ， 指 明 要 提取 的 连 退 分 量 是 4 连 
通 还 是 8 连通 ， 默 认 信 为 8。 
返回 值 : 


° L 为 类 似 于 图 11.23 (b) 的 标注 图 像 ; 
° пит 为 二 值 图 像 Ibw 中 连通 分 量 的 个 数 。 


А1 
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(а) 含有 2 个 连通 分 量 的 图 像 4 (b) 4 的 连通 分 量 标注 图 像 ”(c) 3х3 结构 元 素 S 
411.23 ”连通 分 量 提取 结 


捉 取 连通 分 量 的 应 用 十 分 广泛 ， 利 用 标注 图 像 
可 以 方便 地 进行 很 多 基于 连通 区 的 操作 。 例 如 要 计 
算 东 一 连通 分 量 的 大 小 ， 只 需 扫 摘 一 过 标注 儿 像 ， 
IAAI NIZ X in y PARITI. LUR 
Е 7 АУЛА о, R AAH Е S, FR 
"РТ 18 7712 DC 8 = НИ jx y 坐标 ， 然 
后 计算 其 平均 值 。 


下 面 结合 两 个 MATLAB 实 例 来 说 明 。 

【 例 11.5】 在 人 上 脸 局 部 图 像 中 定位 踢 的 中 心 。 

操作 者 希望 在 如 图 11.24 (а) 所 示 的 图 像 中 定 
位 跨 的 中 心 ， 假 定 已 经 掌握 了 输入 图 像 中 的 菜 些 先 


验 苔 识 ， 即 嘴 部 占据 了 图 像 的 大 部 分 区 域 且 从 灰 度 
上 易于 与 周围 皮肤 分 离开 来 。 于 是 针对 性 地 拟定 了 


在 二 ишш лака 通 区 域 中 心 的 解决 方 


(1) 对 输入 图 像 进行 二 值 化 处 理 。 
(2) 标注 二 信和 图 像 中 的 连通 分 量 。 
(3) 找 出 最 大 的 连通 分 量 。 

(4) 计算 最 大 连通 分 量 的 中 心 。 


依照 上 述 思 路 实现 的 MATLAB 代 码 如 下 ， 读 者 
可 以 在 配套 光盘 第 11 章 Code 目录 下 的 locateMouth.m 
文件 中 找到 。 


% locateMouth.m 


I = imread('mouth.bmp'); % 读 入 图 像 

Id = im2double(I); 

figure, imshow(Id) % 得 到 11.24(a) 

Ibw = im2bw(Id, 0.38); % 以 6.38 为 国信 二 值 化 
Іри = 1 - Ibw; % 为 在 MATLAB 中 进行 处 理 ， 将 图 像 反 色 
figure, imshow(Ibw) % 得 到 11.24(b) 

hold on 

[L，num] = bwlabel(Ibw，8); % 标注 连通 分 量 
disp([' 图 中 共有 ' num2str(num) “个 连通 分 量 ']) 


% 找 出 最 大 的 连通 分 量 〈 嘴 ) 

max = 0; СЕ 
іпамах = 0; % 当前 最 大 连通 分 量 的 索引 
for k = 1:num 


[y x] = find(L == k); % RES УК ХИТ ЖОЖ 
Ууж] 51 Ех 


nSize = length(y); % 计算 该 连通 区 的 像 孙 数目 
if(nSize > max) 
max = nSize; 
indMax = k; 
end 
end 


if indMax == 
disp(' 没 有 找到 连通 分 量 ' ) 
return 

end 


% 计算 并 显示 最 大 连通 分 量 〈 跨 ) 的 中 心 


[y x] = find(L == іпамах); 
yMean = mean(y); 
xMean = mean(x); 


plot(xMean,yMean, 'Marker','o','MarkerSize' ,14,'MarkerEd 
geColor','w','MarkerFaceColor','w'); 
plot(xMean, yMean, 'Marker', '*', 'MarkerSize', 12, 'Ma 
rkerEdgeColor', 'k'); % 得 到 11.24(c) 


上 述 程序 运行 后 结果 如 图 11.24 所 示 。 


可 以 看 到 在 以 0.38 为 国 值 分 割 后 ， 得 到 的 图 
11.24 (b) FW ERHALTENE, AA 
验 知 识 ， 可 以 认为 最 大 的 连通 分 量 对 应 于 路 部 。 语 
Ajly x ] = find(L = 上) 用 来 在 标注 图 像 L 中 找 出 编号 
为 k MEEK WIT RI RESY 和 列 索引 集合 x ， 找 出 


所 有 连通 区 中 最 大 的 一 个 ， 计 算 问 量 y 和 x 的 平均 
值 ， 即 为 该 区 域 中 心 的 坐标 ， 结 算 结 果 在 图 
11.24 (c) 中 用 “*” 显 示 了 出 来 。 





(а) 嘴 部 图 像 mouth.bmp (b) 图 (a) 经 二 值 化 后 (c) 基于 上 述 方法 定位 的 嘴 的 
H: 6699 示 出 


411.24 ”中 部 定位 
【 例 11.6】 细菌 计数 。 


要 对 图 11.25(a) 中 显微镜 视野 内 的 细 本 进行 
计数 ， 操 作者 的 思路 是 在 二 值 化 后 的 黑 日 图 像 中 统 
计 和 连通 区 的 个 数 从 而 确定 细 琴 的 个 数 。 首 先 对 原始 
图 像 进 行 国人 处理， 得 到 名 11.25 (b) 中 的 二 值 化 
图 像 ， 注 意 到 下 方 的 一 个 细 霄 出 现 了 “ 断 仇 >”， 这 可 
Веле H TIR 836464 СА хе {Нн Кле B 
ЛЕ KK E ЛУ], за АЛЕ АВЕ EI 
E ЕН ЛЯ АНУ - 


HKE, MEMAR EA W ri Ж 
扰 ， 针 对 图 11.25 (b) BEI m РЕТ? JEE 
点 ， 操 作者 对 图 11.25 (b) 中 二 值 图 像 采 用 3x3 的 


Мо, ТЕК ЛЕ НУ 18 411.25 (с) 
н, аа ЈК 068°, ЈАЈЕ ХР 
生 不 同 细 菌 的 “合并 ”， 再 统计 图 11.25〈c) 中 的 二 
连通 分 量 的 数目 ， 即 得 到 细菌 的 准确 计 


相应 的 MATLAB 代 码 如 下 。 


imread('bw bacteria.bmp'); % 读 入 二 值 化 后 的 细菌 图 


>> figure, imshow(I) % {4 (6) 
>> [L, num] = bwlabel(I, 8); % 直接 统计 (b) 中 连通 区 个 数 
>> num % 最 示 细 丽 个 数 ， 由 于 “断裂 ”存在 ， 比 实际 数目 多 1 


num = 
22 

>> Idil = imdilate(I, ones(3,3)); % ЖШ3х3Н]# KJ úz] 

>> figure, imshow(Idil) % {3 (с) 

>> [L, num] = bwlabel(Idil, 8); % iit (с) 中 的 连通 区 个 数 

>> пит % KERRIE ANA 


num = 


21 





上 上述 程序 运行 后 的 效 来 如 多 11.25 所 示 。 





(a) 显微镜 下 的 细菌 图 像 (b) 将 图 (a) 中 图 像 二 值 化 后 Сс) 对 图 СЬ) 中 图 像 采 用 3x3 
的 结构 元 素 膨 胀 


图 11.25 ”统计 连通 区 个 数 


3. Visual C++ 实现 


利用 Visual C++ 标注 连通 分 量 的 相关 代 伍 如 
下 。 


ku usa kiasa 


void CImgProcess::LabelConnRgn(CImgProcess* pTo) 


功能 : 标注 连通 分 量 
注 : 只 能 处 理 二 值 图 像 
参数 : CImgProcess* pTo: тостон 指针 


int nConn: 取 值 为 4 或 8， 表 示 4 连 通 或 8 连通 ， 默 认为 8 
返回 值 : int 无 


A 


void CImgProcess::LabelConnRgn(CImgProcess* pTo, int nC 
onn) 


l 

int se[3][3] = {{1, 1, 1}, {1, 1, 1}, {1, 1, 1}}; / 
/ 8 连通 - 3*3 结 构 元 素 

if(nConn == 4)//4 连 通 - 十 字形 结构 元 系 

l 


se[o0][0] = - 


ѕе[0][2] = -1; 

ѕе[2|[0]| = 

se[2]|2 ] 
J 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


II | 
І І 
P = 
чөө Wo 


int i, j, К, 1; // 循 环 变量 


CImgProcess backupImg = *this; // 备 份 原 图 像 以 备 恢复 

CImgProcess tmpImg = *pTo; // 暂 存 上 一 次 的 运算 结果 的 临 
时 图 像 

int nConnRgn = 1; // 连 通 分量 的 标号 

int nGray; 


ЯЛЛ 9 ЕНУ, ИНДА Н 820237 Н 


Ғог(1=0; i<nHeight; i++) 


{ 
ЅеРіхе1(0, i, RGB(255, 255, 255)); 
SetPixel(nWidth-1, і, RGB(255, 255, 255)); 
J 
for(j=0; j<nWidth; j++) 
{ 
SetPixel(j, ©, RGB(255, 255, 255)); 
SetPixel(j, nHeight-1, RGB(255, 255, 255)); 
J 


for(i=0; i<nHeight; i++) 


{ 
for(j=0; j<nWidth; j++) 


{ 
nGray = GetGray(j, i); 


if(nGray == 0) 


pTo->InitPixels(255); // 清 空 目 标 输出 图 像 


// 找 到 一 个 前 景点 ， 提 取 其 所 在 的 连通 分 量 

pTo->SetPixel(j, i, RGB(0, Ө, 0)); // 初 始 化 
目标 图 像 为 只 有 连通 区 中 的 一 点 

tmpImg = *рТо; // #171 


while( true ) // 循 环 直 到 图 像 的 受 限 膨 胀 不 再 产 
生变 换 
{ 


tmpImg.Dilate(pTo, se); // 用 结构 元 素 脱 胀 


*pTo = *pTo & баскирІте; / / 11-27115 RAH] 
А, ЕНК ЛХ Н р bk 


if( *рТо == tmpImg ) 
// 如 果 和 上 一 次 处 理 后 的 图 像 相 同 ， 说 明 该 连通 区 已 经 提取 完毕 
break; 
tmpImg = *pTo; //Ж fÉ 
J 


// 标 注 刚 刚 找到 的 连通 区 
for(k=0; k<nHeight; k++) 
l 
for(1=0; l<nWidth; 1++) 
l 
nGray = pTo->GetGray(1, k); 
if(nGray == 0) 
l 
SetPixel(1, k, RGB(nConnRgn, nConnR 
gn, nConnRgn)); 
ТЕЗАТА БАЕ 6 пСоппАеп 5228 X 


J 
}//for 1 


}//for k 


nConnRgn ++; // 连 通 区 编号 加 1 
if(nConnRgn > 255) 


AfxMessageBox(" 目 前 该 图 数 最 多 文 持 标注 255 个 连 


9758"); 
і = nHeight; // 596 УРН 
break; 
J 
}//if 
}//for j 
}//for i 


*pTo = *this; // НЕ ОТЕ ЛЕ *this) 
*this = backupImg; // 恢 复原 网 像 


利用 LabelConnRgn0 函 数 标 注 连 通 区 域 的 完整 
示例 人 彼 封 装 在 DIPDemo 工 程 中 的 视图 类 子 数 void 
CDIPDemoView::OnMorphLabelConnRgn() 中 ， 其 中 
调用 LabelConnRgn0 函 数 的 代码 厂 汤 如 下 所 示 。 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 LabelConnRgn() 函 数 标 注 连 通 区 域 
imgInput.LabelConnRgn(&imgOutput); 


// 将 结果 返回 给 文档 类 


pDoc->m_ Image = imgOutput; 


斌 者 可 ee re AD en DEA 
РН йү “йу г: A pA > EREE |х Б” ЄЛ Д E N 
Ж. 


11.3.5 1095 K Н. М1виа1 C++ 实现 


РЕН I| AKHU Н, АЧИ И 
的 几何 形状 和 拓扑 HJ, ЕТТИ 会 于 之 
一 。 计 算 骨 淋 的 过 程 一 般 称 为 “ 细 化 ”或 “骨架 化 ”， 
在 包括 文字 识别 、 工 业 和 零件 形状 识 列 以 及 印刷 电路 
板 目 动 检 测 和 在 入 的 很 多 应 用 中 ， 细 化 过 程 都 及 挥 看 
天 键 作 用 。 通 第 ， 对 操作 者 感 兴 趣 的 目标 物体 进行 
细 化 有 助 于 突出 инин КАЛГ АЛЫ, ЛЕН. 
减少 元 余 的 信息 量 


【 例 11.7】 手 与 字符 的 细 化 。 


同类 物体 由 于 其 线条 粗细 不 同 而 显得 兰 列 很 大 
(图 11.26 (а) 和 图 11.26〈c) 中 的 “7”) ， 这 无 疑 
会 给 后 续 的 识别 任务 市 来 困扰， 例如 对 于 图 11 26 中 
的 图 像 来 说 识别 程序 很 可 能 会 认为 图 11.26 (a) 中 
有 “7” 更 像 图 11.26(b)》 中 的 “1” 而 不 是 图 11.26 (с) 
中 的 “7”。 但 将 它们 的 形状 细 化 之 后 ， 归 一 化 为 相 


EREE, HH SA а, НАЈ РД A EI 

11.26 (а) 一 图 11.26 (f) 的 3 幅 数 字 骨 架 图 像 所 体 
现 出 来 的 完全 是 数字 本 里 的 几何 形状 ， 在 这 些 细 化 
на 


111 


(а) 待 分 类 的 手写 字符 7 (b) 比 对 字符 1 (с) 比 对 字符 7 


f 1 T 


(d) 图 (a) 经 过 细 化 后 (e) 图 (b) 经 细 化 后 (Р 图 (Cc) 经 细 化 后 
图 11.26 ”手写 数字 字符 的 细 化 


Е: 第 一 行 中 的 3 幅 图 像 没 有 经 过 细 化 处 理 ， 
可 能 导致 在 分 类 时 图 (a) 中 的 “7” 与 图 (b) 中 的 
比 对 字符 “1” 更 加 相似 ， 图 (a》〉 中 的 每 识 列子 
从 “7” 被 识 列 成 “1”;， 第 二 行为 第 一 行 3 幅 图 像 的 细 化 
图 像 ， 只 要 进一步 从 图 像 中 选择 合适 的 特征 ， 将 得 
PIERRA) 


1. 理论 基础 
下 面 来 看 一 下 细 化 算法 的 实现 思路 。 


考虑 某 图 像 中 的 一 个 3x3 的 区 域 ， 对 其 中 各 点 
标记 名 称 P 1，P 2，...，P 8， 如 图 11.27 (а) 所 


示 。 这 里 规定 以 1 表示 黑色 ，0 表 示 白 色 ， 则 如 果 中 
PEP 1( 令 P 1=0)。 
(1) 2<NZ (Р 1)<6。 
(2) Z0(P 1)=1. 
(3) P 2xP 4xP 8=0 或 者 Z 0(P 1)z1。 
(4) P 2xP 4xP 6=0 或 者 Z 0(P 4)z1。 
其 中 的 标记 NZ (Р) 〈 如 表 11.2 所 示 ) 表示 P 


点 的 8 邻 域 中 1 的 数目 ， 而 Z0 P) 可 按照 如 下 方式 
计算 。 


表 11.2 标记 示意 表 





D “®пСоипг = 0. 


D WRP .1，0=0 并且 P.1，.1=1 


nCount ++ 

©) WRP 1, + =0 并 月 P0 ，_-1 =0 
nCount ++ 

O 如 果 Po，.1=0 并且 P11，.1=1 
nCount ++ 

©) WRP, 1=03+ҢРу, о=1 
nCount ++ 

© WRP, 0=03 НР. {= 
nCount ++ 

O WRP, 1=03НРуо, 15 
nCount ++ 

(8) WRPo, 150 ŽHP í, 151 


nCount ++ 


@ ДП ЖР 1, 170 JF НР 1, 0=1 


9 


nCount ++ 


Z O(P )=nCount 


М КИЙНН CTO SE X Л, ВАЈТ 
的 点 都 不 可 删除 为 止 。 图 11.27 给 出 了 细 化 算法 的 示 
痘 ， 后 面 给 出 了 算法 的 Visual C++ 实现 。 





(а) 3x3 邻 域 (b) 删除 Pl 会 (c) 删除 РІ 会 (d) 2<MZ (P1) 
分 割 区 域 Аң АЫЛ Ж < 6， 但 P1 不 可 删除 


411.27 0955 
2. Visual C++ 实现 
利用 Visual C++ 实现 细 化 的 相关 代码 如 下 。 





六 和 


void CImgProcess::Thining(CImgProcess* pTo) 
功能 : Ж 
注 : 只 能 处 理 2 值 图 象 
参数 : 无 
返回 值 ， Ж 


ВИИИ ТЕРЕКЕ 


void СІтрРгосеѕ5: : Тһіпіпе() 


l 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


// 四 个 条 件 

BOOL bCondition1; 
BOOL bCondition2; 
BOOL bCondition3; 
BOOL bCondition4; 


//5x5 相 邻 区 域 像 系 但 


unsigned char neighbour[5][5]; 


int 1,7; 
int m,n; 


BOOL bModified = TRUE; 


while(bModified) 

l 
bModified = FALSE; 
CImgProcess pic = *this; 
pic.InitPixels(255); //#i НЛ BZ 


for(j=2; j<nHeight-2; j++) 
{ 
for(i=2; i<nWidth-2; i++) 
{ 
bCondition1 = FALSE; 
bCondition2 = FALSE; 
bCondition3 FALSE; 
bCondition4 FALSE; 


BYTE data = GetGray(i, j); 
if(data == 255) 
continue; 


// ЭКАН 5х5 KIRAR E HHGG Не 
‚ мани 
for (m = Ө;м < 5; т++ ) 
{ 
for (п = Ө;п < 5; п++) 
l 
neighbour[m][n] = (GetGray(i + п - 2, 
j +m - 2) == Ө); 


J 
J 
// neighbour|[ |[|] 
// 逐 个 判断 条 件 。 


// 判 断 2<=NZ(P1)<=6 
int nCount = neighbour[1][1] + neighbour[1 
][2] + neighbour[1][3] N 
+ neighbour|[2][1] + neighbour|[2][3] + N 
+ neighbour|[3][1] + neighbour[3][2] + n 
eighbour[3][3]; 
if ( nCount >= 2 && nCount <=6) 
bCondition1 = TRUE; 


//|PrZe(P1)=1 
nCount = 0; 
if (neighbour[1][2] == @ && neighbour[1][1] 


nCount++; 
if (neighbour[1][1] == @ && neighbour[2][1] 


nCount++; 
if (neighbour[2][1] == @ && neighbour[3][1] 


nCount++; 
if (neighbour[3][1] == @ && neighbour[3][2] 


== 1) 
nCount++; 
if (neighbour[3][2] == @ && neighbour[3][3] 
== 1) 
nCount++; 
if (neighbour[3][3] == @ && neighbour[2][3] 
== 1) 
nCount++; 
if (neighbour[2][3] == @ && neighbour[1][3] 
== 1) 
nCount++; 
if (neighbour[1][3] == @ && neighbour[1][2] 
== 1) 


nCount++; 
if (nCount == 1) 
bCondition2 = TRUE; 


// 判 断 P2*P4*P8=6 or 20(р2)!=1 
if (neighbour[1][2]*neighbour[2][1]*neighbo 
иг[2][3] == Өе) 
bCondition3 = TRUE; 
else 
l 
nCount = 0; 
if (neighbour[0][2] == © && neighbour[ 


0][1] == 1) 
nCount++; 
if (neighbour[0][1] == Ө && neighbour[ 
1][1] == 1) 
nCount++; 
if (neighbour[1][1] == 6 && neighbour [ 
2][1] == 1) 


nCount++; 
if (neighbour[2][1] == 6 && neighbour [ 


ur[3][2] 


1) 


nCount++; 
if (neighbour[2][2] == @ && 
1) 
nCount++; 
if (neighbour[2][3] == @ && 
1) 
nCount++; 
if (neighbour[1][3] == 6 && 
1) 
nCount++; 
if (neighbour[0][3] == ө && 
1) 
nCount++; 
if (nCount != 1) 
bCondition3 = TRUE; 
J 


// 判 断 P2*P4*P6=6 or Z6(p4)1=1 


neighbour| 


neighbour| 


neighbour| 


neighbour| 


if (neighbour[1][2]*neighbour[2][1]*neighbo 


== 0) 
bCondition4 = TRUE; 
else 
{ 
nCount = 0; 
if (neighbour[1][1] == @ && 


nCount++; 
if (neighbour[1][0] == Ө && 


nCount++; 
if (neighbour[2][0] == @ && 


nCount++; 
if (neighbour[3][0] == @ && 


neighbour|[1] 


neighbour[2] 


neighbour|3] 


пеівћбоиг [3 | 


nCount++; 
if (neighbour[3][1] == @ && neighbour[3] 


[2] == 1) 
nCount++; 
if (neighbour[3][2] == @ && neighbour[2] 
[2] == 3) 
nCount++; 
if (neighbour[2][2] == @ && neighbour[1] 
[2] == 1) 
nCount++; 
if (neighbour[1][2] == @ && neighbour[1] 
[1] == 1) 


nCount++; 
if (nCount != 1) 
bCondition4 = TRUE; 
J 


if(bCondition1 && bCondition2 && bCondition 
3 && bCondition4) 
{ 
pic.SetPixel(i, j, RGB(255, 255, 255)); 
bModified = TRUE; 
J 


else 


l 
} 


y //for i 
y //for j 
*this = pic; 
}//while 
J 


pic.SetPixel(i, j, RGB(0, ©, @)); 


A) H ThiningO РЁ TSK IN 41 ЯШИ. 562 549145 
封 疙 在 DIPDemo 工 程 中 有 的 视图 类 函数 void 
CDIPDemoView::OnMorphThiningO0 中 ， 其 中 调用 
Thining) K ZARI A Brun F EZR o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调用 Thining() 实 现 图 像 细 化 
imgOutput.Thining(); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 的 运行 结果 如 图 11.28 所 示 ， 旋 者 可 以 
通过 光盘 中 示例 程序 DIPDemo 中 的 菜单 命令 “形态 
尝 变 换 一 细 化 ?来 观察 处 理 效 果 。 





图 11.28 ”图 像 细 化 


11.3.6 ” 像 系 化 算法 及 其 Visual C++ 实现 


细 化 适用 于 和 物体 拓扑 结构 或 形状 有 天 的 应 
用 ， 如 前 述 的 手写 子 和 伍 识 列 。 但 有 时 操作 者 天 心 的 


х НАУ л sfd, БЕЛОВА, KAE 
Ж, XIE ab BBrH JL АЛЖ ж Iz О оз 26 Ji Ж 的 
图 像 分 析 市 来 极 大 的 方便 。 


1. 理论 基础 


像素 化 操作 首先 找到 二 值 图 像 中 所 有 的 连通 区 
域 ， 然 后 用 这 些 区 域 的 质心 作为 这 些 连通 区 域 的 代 
表 ， 即 将 1 个 连通 区 域 像 系 化 为 位 于 区 域 质 心 位 置 
ТАМ. 


有 时 还 可 以 进一步 引入 一 个 低 国 值 JjowerTPhres 

和 一 个 疝 уН иррегТһгез 用 来 指出 图 像 中 操作 者 感 

兴趣 的 对 象 连 通 数 〈 连 通 分量 中 的 像 系 数目 ) 的 大 
致 范 沁 围 ， 从 而 指 像 系 化 图 像 中 大 小 介 于 lowerThres 
和 upperThres 之 间 的 连 角 区域 ， 而 连通 数 低 于 
lowerThres 或 高 于 upperThres 的 对 象 都 将 被 滤 除 ， 
这 束 相 当 于 使 算法 同时 具有 J 了 过 小 品 丽 的 能 力 ， 如 
图 11.29 所 示 。 





) 原始 图 像 4 (b) А ЖЕНУ 


411.29 ЛИЛИ, ІомегТһгеѕ = 3, upperThres = 10 


ZE: А 中 < ІомегТһгеѕ 和 > иррегТһгеѕ 的 连通 
Б So ТЕХ ТАН АИА И / X 
БУЛА Ù o 


2. Visual C++ 实现 


像 系 化 算法 的 实现 中 使 用 了 PixelImageO0 和 
TestConnRgn0 〇 两 个 函数 。 


算法 PixelImage0 逐 行 扫 持 图像， 和 二 全 全 到 一 个 
Я H TestConnRsen() р 526 21 ки Pr E НУЛЕ 
区 束 大 小 ， 如 果 连 通 数 介 于 参数 ljowerThres 和 
иррегТһгеѕ 之 间 ， 表 明 该 连通 区 域 可 能 是 操作 者 天 
心 的 对 象 ， 由 于 每 次 函数 TestConnRgnO 探 符 连 通 区 
者 会 把 该 次 探 得 访问 过 的 点 记录 在 CPoint 型 数组 
ptVisited[] 中 ， 根 据 ptVisited[] 保 存 的 访问 点 记录 就 
可 计算 出 区 域 的 质心 ， 于 是 算法 用 质心 处 的 一 个 黑 
像 系 代 表 讼 连通 区 域 ; 如 连通 数 不 在 JowerThres 和 
upperThres Z], MZEMBE; T a RYA 
LEITAR. 266 НЕ [х HAKR Hl 
В. 


| pa УРИ ypt 


void CImgProcess::PixelImage(CImgProcess* pTo, int lowe 
rThres, int upperThres) 


功能 : 像素 化 大 小 介 于 upperThres 和 lowerThres 之 间 的 连 
通 区 域 ， 像 系 化 的 像 系 位 置 为 原 区 域 的 质心 ; 
滤 除 大 小 低 于 lowerThres 的 连通 区 域 
滤 除 大 小 超过 upperThres 的 连通 区 域 
注 : 只 能 处 理 2 值 图 象 
参数 : CImgProcess* pTo: НАХ CImgProcess 指针 
upperThres: LEE ИН 
lowerThres: РИА 
返回 值 ， Ж 
РВЕ 
void CImgProcess::PixelImage(CImgProcess* pTo, int lowe 
rThres, int upperThres) 


l 


if(upperThres < lowerThres) 


AfxMessageBox(" Е 88 ZW KT РИН! "); 
return; 


} 


if(lowerThres < 0) 
lowerThres = 0; 
if(upperThres > 1000) 
upperThres = 1000; // 为 防止 深度 递归 栈 荔 处 ， 限 定 upp 
erThres 的 最 大 值 为 1668 


CImgProcess image bkp = *this; 

CImgProcess image nes = *pTo; 

image_res.InitPixels(255); // 存 放 像 系 化 后 的 图 像 ， 人 初始 
NAE CAR) 


int nHeight = pTo->GetHeight(); 
int nWidth = pTo->GetWidthPixel(); 
int i,j; 

unsigned char pixel; 


LPBYTE lpVisited = new BYTE[nHeight*nWidth]; // 标 记 
该 位 置 是 任 已 被 访问 过 


for(i=0;i<nHeight*nWidth;i++) 
lpVisited[i] = false; // 初 始 访问 标记 数组 


int curConnRgnSize = Ө; // 当 前 发 现 的 连通 区 的 大 小 


int nPtArySize = upperThres + 10; // 记 录 访 问 点 坐标 数 
组 的 大 小 ， 是 一 个 不 能 小 于 upperThres WE 

CPoint* ptVisited;// 记 录 对 于 连通 区 的 一 次 探 答 中 访问 过 的 
点 的 坐标 

ptVisited = new СРоіп+ [ пРЕАгуѕЅіхе |; 


int k = 0; 
for(i=0;i<nHeight; i++) 


l 
for(j=0;j<nWidth;j++) 


for(k=0;k<curConnRgnSize;k++) 
1pVisited[ptVisited[k].y*nWidth + ptVi 
sited[k].x] = false; 
// 还 原 lpVisited 数组 


curConnRgnSize = 0; // 重 置 为 8 
pixel = image bkp.GetGray(j, i); 


if( pixel == 6 ) // 找 到 1 个 黑 像 素 ， 进 而 探查 该 像 
素 所 处 的 连通 区 域 的 大 小 


l 
int nRet = TestConnRgn(&image bkp, lpVisi 
ted, nWidth, nHeight, J, 1, ptVisited, lo 


werThres, upperThres, curConnRgnSize); 
if(nRet == 0) // lowerThres<= ... <=иррег 
Thres 
l 
// 计 算出 区 域 的 质心 
int xMean = ð; 
int yMean = 0; 
for(k=0; k<curConnRgnSize; k++) 
l 
image res.SetPixel(ptVisited[k].x, p 
tVisited[k].y, 
RGB(255, 255, 255)); 


xMean += ptVisited|[k].x; 
yMean += ptVisited[k].y; 
J 
xMean xMean / curConnRgnSize; 
yMean = yMean / curConnRgnSize; 


image res.SetPixel(xMean, уМеап, RGB(®, 


Ө, @)); 
} 
else if( (nRet == 1) || (nRet == -1) ) // 
>upperThres or <lowerThres 
{ 
/ DEIR 
for(k=0; k<curConnRgnSize; k++) 
{ 
image res.SetPixel(ptVisited[k].x, 
ptVisited|[k]. 
y, RGB(255, 255, 255)); 
J 
} 


y// for j 
}// for i 


*pTo = image res; 


delete [J]lpVisited; 
delete [ JptVisited; 





РЁ ЖГ ТеѕіСоппКеп() 2 52: х y 指出 的 点 (x 
‚ у) 所 在 的 连通 区 大 小 ， 你 存在 引用 参 
数 curConnRgnSize 中 市 回 。 算 法 递归 地 探 咎 (х, y 
) 的 8 个 邻 域 ， 直 到 已 访问 过 该 连 通 区 匡 中 所 有 的 
尽 ， 对 这 个 函数 和 加 修改 也 可 用 于 提取 连通 分 量 。 
函数 的 返回 值 以 及 其 他 参数 的 含义 请 参考 函数 之 前 
的 评 细 注释 ， 其 实现 代 倘 如 下 。 


站 


TestConnRgn(CImgProcess* pImage, LPBYTE lpVisited, int 
nWidth, int nHeight, int x, int y, CPoint ptVisited| |, 
int lowerThres, int upperThres, int &curConnRgnSize) 
功能 : 利用 化 归 算 法 统计 点 (x, у) 所 处 的 连通 区 的 大 小 坷 lo 
werThres 和 upperThres 之 间 的 关系 

注 : 只 能 处 理 2 值 图 象 

参数 : ”CImgProcess* pImage: 处 理 图 像 的 CImgProcess 指针 


LPBYTE lpVisited: 标志 位 数组 
int nWidth: 图 象 的 宽度 

int nHeigh: 图 象 的 高 度 

int x: 当前 考察 点 的 横 坐 标 

int y: 当前 考察 点 的 纵 坐 标 


Cpoint ptVisited[]: 存放 已 考取 过 有 的 点 的 坐标 
int curConnRgnSize: 当前 为 止 发 现 的 连通 区 的 大 小 
返回 值 : int 
= 0: 连通 区 大 小 介 于 lowerThres 和 upperThres 之 间 
= 1: 连通 区 大 小 超过 upperThres 
=-1: 连通 区 大 小 低 于 lowerThres 
ЖЕЕ ЕЕЕ ЕТЕ ЕЛЕЕ КЕЕ EREE 
int CImgProcess::TestConnRgn(CImgProcess* pImage, LPBYT 
E lpVisited, int nWidth, int nHeight, int x, int y, CPo 
int ptVisited|], int lowerThres, int upperThres, int &c 
urConnRgnSize) 


l 


if(curConnRgnSize > upperThres) // 连 通 区 大 小 已 超过 上 
Кж {ШиррегТһге$< 
return 1; 


curConnRgnSize++; // 更 新 当前 为 止 用 现 的 连通 区 的 大 小 
1pVisited[nWidth*y+x]=true; // 标 记 已 访问 


ptVisited[curConnRgnSize-1].x=x; 
ptVisited[curConnRgnSize-1].y=y; // 记 录 已 访问 点 坐标 


unsigned char gray; 


if(curConnRgnSize >= upperThres) 
return 1; 
else 
{// 测 斌 8 邻接 的 点 ， 如 果 仍 为 黑色 〈 物 体 ) ， 递 归 调 用 目 己 《〈 连 
通 区 大 小 +1， 继 续 考 察 邻 接点 的 8 邻接 氮 ) 


// 上面 的 点 
1Ғ(У-1>=0) 


gray = pImage->GetGray(x, у-1); 
if(gray==0 && lpVisited[(y-1)*nWidth+x] == false 


) 
TestConnRgn(pImage, lpVisited, nWidth, nHeig 
ht, x, y-1, ptVisited, 
lowerThres, upperThres, curConnRgnSize); 
J 
if(curConnRgnSize > upperThres) 
return 1; 


1/25 L AA 
if(y-1>=0 && х-1>=0) 
l 
gray = pImage->GetGray(x-1, у-1); 
if(gray==0 && lpVisited[(y-1)*nWidth+x-1]==false 
) 
TestConnRgn(pImage, lpVisited, nWidth, nHeight 
,X-1,y-1,ptVisited, 
lowerThres, upperThres, curConnRgnSize 


); 


if(curConnRgnSize > UpperThres ) 
return 1; 


// 左 边 
1Ғ#(х-1>=0) 
l 
gray = pImage->GetGray(x-1, у); 
if(gray==0 && lpVisited[y*nWidth+x-1]==false) 
TestConnRgn(pImage, lpVisited, nWidth, nHeig 
ht, x-1, y, ptVisited, 
lowerThres, upperThres, curConnRgnSize); 
J 
if(curConnRgnSize > upperThres) 
return 1; 


[Жр 
if(y+1<nHeight && х-1>=0) 
l 
gray = pImage->GetGray(x-1, у+1); 
if(gray==0 && lpVisited[(y+1)*nWidth+x-1]= 
=Ға1ѕе) 
TestConnRgn(pImage, lpVisited, nWidth, nHe 
ight, x-1, у+1, ptVisited, 
lowerThres, upperThres, curConnRgnSize); 
J 


if(curConnRgnSize > upperThres) 
return 1; 


/ ТЛ 
if( y+1<nHeight) 
{ 
gray = рІтаре->беїбгау(х, у+1); 
if(gray==0 &&lpVisited[(y+1)*nWidth+x]==false) 


TestConnRgn(pImage, lpVisited,nWidth,nHeight,x 
,y+1 ,ptVisited, 


); 


lowerThres, upperThres, curConnRgnSize 


if(curConnRgnSize > upperThres) 
return 1; 


//# F 
if(y+1<nHeight && x+1<nWidth) 
l 

gray = pImage->GetGray(x+1, у+1); 

if(gray==0 && lpVisited[(y+1)*nWidth+x+1]==false 
) 

TestConnRgn(pImage, lpVisited,nWidth,nHeight,x 

+1,y+1,ptVisited, 
lowerThres, upperThres, curConnRgnSize); 


if(curConnRgnSize > upperThres) 
return 1; 


//A 
if(x+1<nWidth) 
l 
gray = рІтаре->беїбгау(х+1, y); 
if(gray==0 && lpVisited[y*nWidth+x+1]==false) 
TestConnRgn(pImage, lpVisited, nWidth, nHeight 
› X+1, y, ptVisited, 
lowerThres, upperThres, curConnRgnSize); 
J 
if(curConnRgnSize > upperThres) 
return 1; 


//# L 
if(y-1>=0 && x+1<nWidth) 
l 
gray = pImage->GetGray(x+1, у-1); 
if(gray==0 && lpVisited[(y-1)*nWidth+x+1]==false 
) 
TestConnRgn(pImage,lpVisited,nWidth,nHeight,x+ 
1,y-1, ptVisited, lowerThres, 
upperThres, curConnRgnSize); 


) 


if(curConnRgnSize > upperThres) 
return 1; 


y//else 


if (curConnRgnSize < lowerThres) 
return -1; // 连 通 区 大 小 低 于 lowerThres 


return 0; / /连通 区 大 小 介 于 lowerThres 和 upperThres 
之 间 


— oE" 
Way йен ңы РЯ 数 实现 КЕ 的 完整 示 


er er т ， 其 中 调用 
РіхеПтаре() A 87/9 Т КРТ. 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 这 里 设 定 低 浆 值 为 186， 高 国 值 为 166, 连 通 数 <16 和 连通 数 >366 的 
连通 区 被 泪 除 ， 之 间 的 被 像素 化 

nLowThres = 10; 

nHighThres = 300; 


// 调用 PixelImage() 实 现 图 像 细 化 
imgInput.PixelImage(&imgOutput, nLowThres, nHighThres 
); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 
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11.3.7 ”四 元 及 其 Visual C++ 实现 
1. 理论 基础 


如 果 连 接 物 体 A 内 任意 两 点 的 直线 段 都 在 A 的 
内 部 ， 则 称 A 是 凸 的 。 任 意 物 体 A 的 凸 壳 五 是 包含 2 
НИ) ЛУН ИЖ 


РЕТ Ел Б. лел ЕН 1Ж 28 1 Pl. 12 НЕЛЕ +k ЈИ HJ Ji 
ПК ИИК, ХЕЛЕ у НП, n peH TERDI 
З ЈА ИЕ B Ir), ИИА ЯЕ 
mo А А СТ Е Е НУЛА Oo НУ 
педа ЕАК, УКАМ, IARR l| 
含 原始 形状 的 最 小 凹 多 边 形 ， 如 图 11.30 所 示 。 





411.30 А А 


令 S! ，i=1，2，3，4, 表 示 图 11.31 中 的 4 个 结构 
TA. Mp FEU F -o 


Хі (Хуе S )UA 1=1, 2, 3, 4 k =1, 
25 s) зш 
Хо! =A。 Фр! =Xcony ， 这 里 下 标 “conv” 表 
示 在 和 1=Xk -1 НКК, А НЕ: 


С(А) = U D 
L= 


用 结构 元 素 $ 工 对 A 反复 进行 击 中 击 不 中 变换 ， 
直到 不 再 发 生 进 一 步 变 化 时 ， 与 A 求 并 集 ， 结 果 记 
作 D1。 由 结构 元 素 S! (1=2, 3, 4) 和 A 进行 相同 
的 运算 可 得 Di (i=2，3，4) 。 最 后 ，4 个 DD 的 并 
组 成 了 A А56. 


к 


411.31 Я ЈА 
Е: ХКК НИН. 
АКТЕ БУЕ е Н ПЧ л Н h H E 
BH a Jae N 2, uj REHA RK E ГЦ 4 
会 超出 初始 时 包含 物体 A Ва. 
2. Visual C++ 实 现 
利用 Visual C++ 实 现 同 过 的 相关 代 代 如 下 。 


void CImgProcess::Convex(CImgProcess* pTo, bool bConstr 
ain) 
功能 : ИЧИ НИИ АЕ 
注 : 只 能 处 理 2 值 图 象 
参数 : 1таре* pTo: 目标 输出 网 像 的 CImgProcess 指针 
bool bConstrain: 是 个 限制 凸 索 的 生长 在 包含 最 初 物 
体 的 最 小 矩形 之 内 
返回 值 : 无 
БЕ ЕЕЕ ЕЛЕ ЕК ЕЕЕ ERT 
void CImgProcess::Convex(CImgProcess* pTo, BOOL bConstr 
ain) 


// 计 算 凸 元 需要 的 4 个 结构 元 系 


/* 
sel = 1 -1 -1 se2 = 1 1 1 se3 = -1 -1 1 se4 
= -1 -1 -1 
1 Ө -1 -1 0-1 -1 0 1 -1 O -1 
1 -1 1 -1 -1 -1 -1 -1 1 1 1 1 
e7 


int se1[3][3] = {{1, -1, -1}, {1, ©, -1}, {1, -1, - 
1}}; /弥补 右 侧 的 喇 缺 

int se2[3][3] = {{1, 1, 1}, {-1, ©, -1}, {-1, -1, - 
1}}; УХА FH i ik 

int se3[3][3] = {{-1, -1, 1}, {-1, ©, 1}, {-1, -1, 
1}}; КРАСИВА 

int se4[3][3] = {{-1, -1, -1}, {-1, ө, -1}, {1, 1, 
1}}; ИКА EMM K prh ik 


int nHeight = GetHeight(); 

int nWidth = GetWidthPixel(); 

int i, j; // 图 像 循环 变量 
pTo->InitPixels(255); // 清 空 目 标 输 出 图 像 


// 采用 第 1 个 结构 元 素 


CImgProcess tmpImg1 = *this; // 暂 存 上 一 次 的 运算 结果 


while(true) 
{ 
tmpImg1.Erode(pTo, sel); // “519 seo) ШЕ ЕНЕ Ду 
中 变换 


*pTo = *рТо | tmpImg1; 


if(tmpImg1 == *pTo) 
break; // 算 法 收敛 终止 


tmpImg1 = *pTo; 
} 


// 采用 第 2 个 结构 元 素 
CImgProcess tmpImg2 = *this; // 暂 存 上 一 次 的 运算 结果 


while(true) 
{ 
tmpImg2.Erode(pTo, ѕе2); // 不 完全 育 景 包 于 的 击 中 击 不 
中 变换 


*pTo = *рТо | tmpImg2; 


if(tmpImg2 == *pTo) 
break; // 算 法 收敛 终止 


tmpImg2 = *pTo; 
} 


// 采用 第 3 个 结构 元 素 
CImgProcess tmpImg3 = *this; // 暂 存 上 一 次 的 运算 结果 


while(true) 
{ 


tmpImg3.Erode(pTo, se3); // ^9 жк ЕБ УТ Н ТЕ 4" 
中 变换 
*pTo = *pTo | tmpImg3; 


if(tmpImg3 == *pTo) 
break; // Я 5191 


tmpImg3 = *pTo; 
} 


// 采用 第 4 个 结构 元 素 
CImgProcess tmpImg4 = *this; // 暂 存 上 一 次 的 运算 结果 


while(true) 
l 
tmpImg4.Erode(pTo, <е4); // А529 жк G) УЕ ЕН ТЕ 4" 
中 变换 


*pTo = *рТо | tmpImg4; 


if(tmpImg4 == *pTo) 
break; // 算 法 收敛 终止 


tmpImg4 = *pTo; 
} 


// 计算 4 次 运算 结果 的 并 集 
pTo->InitPixels(255); 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


if( (tmpImg1.GetGray(j, i) == Ө) || (tmpImg2.Get 
Gray(j, i) == 6) || (tmpImg3.GetGray(j, i) == Ө) || (tm 
pImg4.GetGray(j, i) == ө) ) 
pTo->SetPixel(j, i, RGB(0, Ө, 0)); 


// misalkan НУЧ 


// е rH KR yu, Bi] (G) ЕКШ EJE 2 
int nTop = nHeight; 
int nBottom = 0; 
int nLeft = nWidth; 
int nRight = 0; 
for(i=0; i<nHeight; i++) 
{ 
for(j=0; j<nWidth; j++) 


if(GetGray(j, i) == 0) 


if(i < nTop) 
nTop = i; 

if(i > nBottom) 
nBottom = i; 

if(j < nLeft) 
nLeft = j; 

if(j > nRight) 
nRight = j; 

J 
J 
J 


if(bConstrain) 
l 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


if( (i<nTop) || (i>nBottom) || (j<nLeft) || (j 
>nRight) ) 


pTo->SetPixel(j, i, RGB(255, 255, 255)); 
) 


y//if(bConstrain) 


}//Convex( ) 





АІ Convex) А 1 9те с ЙИ 
+] 227ЕОІРрето Г F НА 2 A 5 уоіа 
СрІРрретоуУіем::ОпМогрћСопуех 0 中 ， 其 中 调用 
Сопуех() рК Z AJARI АТАП F ТУХ o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 这 里 设 定 低 浆 值 为 6， 高 国 值 为 366 ,连通 数 <16 和 连通 数 >366 的 
连通 区 被 滤 除 ， 之 间 的 被 像 系 化 

nLowThres = 10; 

nHighThres = 300; 


// 调用 PixelImage() 实 现 图 像 细 化 
imgInput.PixelImage(&imgOutput, nLowThres, nHighThres 
); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





吓 壳 计算 结 末 如 图 11.32 所 示 ， 读 者 可 以 通过 光 


中 示例 程序 DIPDemo 中 的 采 早 命令 “形态 学 变换 
> лу” ЖАЛ Ж АР -o 





(a) bw mouth VC.bmp (b) (a) Нур 
411.32 ORAR 
11.3.8 bwmorph() Ж 


Ж []1# Z JES pe ЕА HIPT rA% 
bwmorphO 实 现 ， 访 函数 的 调用 语法 如 下 。 


Iout = bwmorph(I, operation, n); 


参数 说 明 : 


。 本 为 输入 二 值 图 像 ; 

o operation х= “АХЕЯ ДЈ ЕВ, i H 
的 合法 取 值 如 表 11.3 所 示 : 

e ESAn 是 一 个 下 整数， 用 于 指定 将 侯 草 复 的 
操作 次 数 ， 默 认为 1。 当 n =Jnf 时 表示 重复 操作 


一 二 到 图 像 集 止 改变 为 止 。 
返回 值 : 


° lout 为 经 过 n 次 由 operation 参数 指定 的 形态 学 操 
作 后 的 输出 图 像 。 


表 11.3 ”operation 参数 音 用 取信 及 意义 
值 


ЖТ ЕН ЕЛЖ Ж ЭЕ ЛИ ИЛИ И ЖА 


'clean' 清除 孤立 的 前 景 像素 


'diag' 统 对 角 线 相连 的 前 景 像素 进行 填充 


填充 单个 像素 的 孔洞 


去 挥 前 景 中 的 H 形 连结 


‚|Р 的 8 邻 域 中 一 半 以 上 的 像素 为 前 景 像素 ， 则 使 P 也 为 前 景 像素 ， 否 则 使 P 
majority | 为 背景 像素 


去 处 内 部 像素 《无 背景 像 了 系 相 邻 的 前 景 像素 ) 
将 物体 收缩 为 一 个 点 或 者 带 洞 的 环形 
骨骼 化 图 像 


'spur' 去 除 “ 毛 刺 ” 








四 粗 化 物体 





将 物体 细 化 至 最 低 限 度 相 连 的 线形 


114 ЖЕНКА 
算 

本 节 把 二 值 图 像 的 形态 学 处 理 扩展 到 灰 度 图 像 
的 基本 操作 ， 包 括 灰 度 膨 胀 、 灰 度 腐蚀 、 灰 度 开 和 
灰 度 财 。 此 外 ，11.4.4 小 节 还 将 介绍 一 个 灰 度 形态 
学 的 经 典 应 用 一 一 顶 帽 变换 (top-hat〉， 用 以 解决 
图 像 的 光照 不 均 问 题 。 
11.41 ЖЕК Л АЗЕ, 
1. 理论 基础 


ФЕ ККЗ 1, SHAHIR, EHS Е 
进行 膨胀 ， 记 作 Fs S ， 形 式 化 地 定义 为 : 


(F Фф 5)(2,0) = max{ Рт -x,y — y) + Sy NT, € Ds] 





(11-9) 


其 中 ， Ds AES HJ E X Eko 


计算 过 程 相当 于 让 结构 元 系 $ ЖЕЛИ SA BU 1185 
在 图 像 F 的 所 有 位 置 上 滑 过 ， 而 在 此 过 程 中 要 保证 
(х+х?, yty’) ЕК ИЕ ZN. ВКА 
ras 在 其 定义 域内 每 一 点 (x у) 处 的 取 值 为 以 
(x, у) 为 中 心 ， 在 8 规定 的 局 部 邻 域 内 已 5 之 
和 的 最 大 值 。 例 如 ， 对 于 正方 形 结构 元 系 S (-x 0 
~x0, -y0~y0, FOKO, 0) ) ， 鹏 上 胀 结果 为 F 
与 ;之 和 在 局 部 邻 域 [x x 0, x+x 0, у-у0, y +y 0 
内 的 最 大 值 。 注 意 这 一 过 程 与 苍 积 有 许多 相似 之 
А, Ях На ХАЈА НИКАК, ШАН S 
IN Б; н ЕЛЯ o 


ЭМЖМ] ЈЕ, F (х,у) MS (х,у 
) АШ НИКАК НЈ Т, пле ERA, “IU 
Уле Y ka BH [ Tejo, ЖУКЕЛ АЕ Б, 
ЕҢ РЁ AUE TB HE o 


多 11.33 给 出 了 一 维 丈 度 月 胀 的 示 晶 图 ， 如 让 
11.33 (с) 中 所 示 ， 在 x 0 处 Fas(x0) 的 什 即 为 max 
{F (x 0-x ')+5 (x )|-x 0<x '<x 0}， 有 具体 到 这 里 应 为 
+F (x О+х 0); 而 在 t 4bF es (t) = max {Е (t -x )+S (x 
)|-x 0<x '<x 0} =F (t)+h 注意 造成 rss(x) 中 国 部 
у тиити JEF (x Ex = t 处 达到 了 局 部 最 

值 。 


F (x) =max Í F (x—x') +S (х') |—-х0<х'<х0} 


Е (х) 
Е+$ 
S (х) ⁄ Z: | Ыы 
}h Ai к е F (x) 6 
a =%0 х0 i i 
(а) ЖР Е (х) (b) 一 维 结构 元 素 9 (х) 
h { 
0 t—-x0 t x0 


(c) 一 维 灰 度 膨胀 示意 ,外 围 的 长 虚线 给 出 了 膨胀 结果 人 @S 
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PR J RA mU E JZ ЛУ АУК, ЗЕЛ ИЕН H 
ШЖ Нд ЛГ?Н СаО) 的 结构 元 系 ， 这 种 
结构 元 系 只 能 由 0 和 1 组 成 ， 为 1 的 区 域 指明 了 运算 
涉及 的 范围 。 实 际 上 ， 二 值 形 态 学 中 的 结构 元 系 可 
视 为 一 种 特殊 ( 融 度 为 0) 的 灰 度 形态 结构 元 素 。 
“АУ НН ЛУ л АЕ, ЖБЕК аА S Јр 
最 大 全 运算 ， 其 计算 公 陈 可 简化 为 : 


ЕФ S(z,y) = max{ f(x — ry — y| y) € Ds) 
(11-10) 
2. MATLAB 实 现 
只 要 以 灰 度 图 像 和 相应 的 灰 度 膨胀 结构 元 系 为 


参数 调用 imdilate0 函 数 即 可 实现 灰 度 膀 胀 。 和 平坦 疆 
构 元 率 的 创建 方法 与 二 值 形 态 学 中 相同 ;而 非 平 坦 


ДЕ ҖЫ Ju #= TB PE Estre ORU F y Ке. 





参数 说 明 : 
。NHOOD іН ло ЈА Е, Н ВЕН 
0 和 1 组 成 ; 


• HEIGHT 是 一 个 与 NHOOD 具有 相同 尺寸 的 矩 
阵 ， 指 出 了 对 应 于 NHOOD 中 每 个 元 素 的 高 度 。 


j eÉ : 
° SE JB || НЈАЕЗР 20020. 


FAAA ЙЇ11.8Ж w Hstrel0Mimdilate) ЕЁ žE 
IKER P AJH A. 


[07111.81 KEEK. 


DAH BRNA PE M AEIR KMA 2 16 
ЙК, JFR h EKET Л HI eK 47. 


相应 的 MATLAB 实 现代 码 如 下 。 


››>›+=[0123454з321 0]; 
>> figure, h f = plot(f); 


>> 

>> seFlat = strel([1 1 1]) % 构造 平坦 (高 度 为 69) 的 结构 元 素 
seFlat = 

Flat STREL object containing 3 neighbors. 


Neighborhood: 

1 1 1 
>> fd1 = imdilate(f, seFlat); % 使 用 平坦 的 结构 元 素 灰 度 脱 
ЛЕ 


>> hold on, h +41 = plot(fd1, '-ro'); 

>> axis([1 11 6 8]) 

>> 

>> seHeight = strel([1 1 1]，[1 1 1]) % 注意 此 处 strel 的 
用 法 ， 第 一 个 参数 的 元 素 为 6 或 1， 表 示 结 构 元 素 的 区 域 范 围 《〈 形 状 ) 
， 第 二 个 参数 表示 结构 元 素 中 各 个 元 系 的 融 度 


seHeight = 
Nonflat STREL object containing 3 neighbors. 
Neighborhood: 
1 1 1 
Height: 
1 1 1 


>> fd2 = imdilate(f, seHeight); #18 ИН BEKALAN 
2) ФИК 

>> hold on, h fd2 = plot(fd2, '-g*'); 

>> legend('J k] 124EpR 2 f', ЕНН GS ZK) i, IE 
H raj 51А J Jú z& ZK Ji '); 


上 述 程序 的 运行 绪 末 如 图 11.34 上 所 示 。 





411.34 KEH 
3. Visual C++ 实现 


КШ tH pe АУЗ JH Zñ J pú ж ЖЛЕ JIK HJ 
GrayDilate) HIE, УИЧ K h. Ж АЛИН 
х НЕЙ JG SSE , НЕА А ЖЛ] 
nTempH 种 nTempW 以 及 其 中 心 位 置 nTempM7 和 
nTempMX 8} п]. 


{ЕЛЕЕ S КЕЗЕБЕ В 

void CImgProcess::GrayDilate(CImgProcess* pTo, int пТет 
pH, int nTempW, int nTempMY, int nTempMX, int** se) 
功能 : IRIZ BHRI IK 


Е: НЕН АНЫ ж 
参数 : CImgProcess* pTo: 目标 图 像 的 CImgProcess 指针 


int nTempH: 模板 的 高 虐 
int nTempW: 模板 的 宽度 
int nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( <= iTempH - 1) 
int  nTempMX: 模板 的 中 心 元 素 X 坐 标 ( <= iTempW - 1) 
int** se: 结构 元 素 
返回 值 : Ж 
о Sos Pi 
void CImgProcess::GrayDilate(CImgProcess* pTo, int nTem 
pH, int nTempW, int nTempMY, int nTempMX, int** se) 


// її a 
int i, J, k, 1; 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


for(i=nTempMY;i<nHeight - nTempH + nTempMY + 1;1++) 


l 
for(j=nTempMX;j<nWidth - nTempW + nTempMX +1;j++) 


BYTE maxVal = 0; // 局 部 最 大 值 
for(k=0;k<nTempH;k++) 
{ 


for(1=0;1<nTempW;l++) 
l 
if( se[k][1] == 1 ) 


// 图 像 第 i - nTempMY + k 行 ， 第 j] - nTempMX + 
1 个 像素 的 灰 虐 


BYTE gray = GetGray(j-nTempMX+1, i-nTempMY 
+K ) ; 


// 求 局 部 最 大 值 
if( gray > maxVal ) 
maxVal = gray; 


} 
y//1 
}//k 


pTo->SetPixel(j, i, RGB(maxVal, maxVal, maxVal)) 


y// for j 
}//for i 


А) 9 Сгауріаѓе() РЁ Ži SE I Zk JE BE HK НУ с Жл W 
35] Эм TEDIPDemo T rH WI AIK K %tvoid 
CDIPDemoView::OnMorphGraydilate 0 中 ， 其 中 调 
ЊН Стауріаѓе() A 8779 ЖТ F o 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 GrayDilate( ) 实 现 灰 度 膨胀 
imgInput.GrayDilate(&imgOutput, 3, 3, 1, 1, se); 

// 这 里 se 是 一 个 int ** 指 针 ， 表 示 结 构 元 系 。 这 里 采用 了 3*3 原 点 位 
于 中 心 的 结构 元 素 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


| 

上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设 置 
结构 元 勾 。 旋 者 可 以 通过 交 盘 中 示例 程序 DIPDemo 
中 的 采 早 命令 “形态 学 变换 ДВД АРН 
ЖИЕ. © 


11.42 ЖЕМ ЖУЗЕ 
1. 理论 基础 


令 忆 表示 灰 度 图 像 ，3 为 结构 元 素 ， 使 用 S 对 FF 
进行 腐蚀 ， 记 作 FeS， 形 式 化 地 定义 为 : 
(F e S )(x ‚ y ) = miníF(z +m .,у+у)—5(т,у))(жт,у)Єє Ds) 
(11-11) 


其 中 ，Ds ES 的 定义 域 。 


计算 过 程 相当 于 让 结构 元 系 在 图 像 F 的 所 有 位 
年 上 请 过 ， 而 在 此 过 程 中 要 你 证 (x +x', y +y 9462 
在 图 像 F 之 内 。 腐 蚀 结果 Fe S 在 其 定义 域内 每 一 点 
(х,у) 处 的 取 值 为 以 (x, у) 为 中 心 ， 在 5 规定 
НУЛА ОРЕ 575 Z ME 


ЭМЕМ НЕ, F (x ,y ) 和 S (x ,y ) 个 


Fo ЯА ЕЈЯ т, MEZERA, СИНЧЕ 
义 域 指明 了 其 形状 ， 它 们 的 全 指出 了 高 度 信息 。 


【 例 11.9】 KER. 


分 别 用 高 度 为 1 和 平坦 的 结构 元 隶 实 现 灰 度 诊 
也， 并 绘制 出 腐蚀 前 后 的 函数 图 形 。 


相应 的 MATLAB 代 码 如 下 。 


Ғ= [012345432160]; 
>> figure, h f = plot(f); 
>> seFlat = strel([1 1 1]) % 构造 平坦 (高 度 为 9) 的 结构 元 素 
seFlat = 
Flat STREL object containing 3 neighbors. 
Neighborhood: 

1 1 1 


>> fel = imerode(f, seFlat); % 使 用 平坦 结构 元 素 的 灰 度 腐 蚀 
>> hold on, h fel = plot(fel, '-ro'); 
>> axis([1 11 6 8]) 


>> seHeight = strel([1 1 1]，[1 1 1]) % 注意 此 处 strel 的 
用 法 ， 第 一 个 参数 的 元 了 系 为 6 或 1， 表 未 结构 元 系 的 区 域 施 围 (形状 ) 
， 第 二 个 参数 表示 结构 元 系 的 局 度 


seHeight = 
Nonflat STREL object containing 3 neighbors. 
Neighborhood: 
1 1 1 
Height: 
1 1 1 


>> fe2 = imerode(f, seHeight); % 使 用 具有 高 度 的 结构 元 素 的 
2) Ja VB 

>> hold on, h fe2 = plot(fe2, '-g*'); 

>> legend('J 2k] 12ERR Е", HFHH A", E 
Н е2 2J1BJZ5 EJ а"); 





上 述 程序 的 运行 绪 末 如 图 11.35 上 所 示 。 


— MAKAI #Ë Г 
一 9 使 用 平坦 结构 元 素 腐 蚀 后 
使 用 高 度 为 1 的 结构 元 素 腐蚀 后 





图 11.35” 灰 度 腐蚀 
【 例 11.10】 ЛКК ЛЕ ИНН) ЖЕЕ. 


E o 


KH EM aE 13х32 Ыл = xJ | Шепа.ыпр?7 
DEITA E KAAK ЛЕ ЕН МАТ АВТ ЫП К. 





>> I = imread('lena.bmp'); 
>> seHeight = strel(ones(3, 3), ones(3, 3)) % 3*3 正 方形 
ВУ тап ДЕ MATA 


seHeight = 
Nonflat STREL object containing 9 neighbors. 


Neighborhood: 
1 1 1 
1 1 1 
1 1 1 
Height: 
1 1 1 
1 1 1 
1 1 1 


>> Idil = imdilate(I, seHeight); 
>> Iero = imerode(I, seHeight); 

>> subplot(1, 3, 1), imshow(I) 22411.36 (a) 
subplot(1, 3, 2), imshow(Idil) % 得 到 网 11.36 (b) 
subplot(1, 3, 3), imshow(Iero) % 得 到 图 11.36 (c) 


上 述 程序 的 运行 绪 末 如 图 11.36 所 示 。 


可 以 看 到 在 结构 元 系 的 值 艾 大 于 零 的 情况 下 ， 
灰 度 膨 胀 的 输出 图 像 总 体 上 比 输入 图 像 更 完 ， 这 有 是 
局 部 最 大 值 运算 作用 的 结 东 ， 此 外 诛 图 傈 中 一 些 能 
е Гло ННН АН рт С МА У УЖИ 
MER с УНК, ERAI E ub lli Ti tB яК 
GEP] S — EIER ERIR. П КЛЕЈ REH EW 
ТН, ME Seeram A ЧИ EI, RRA И 
НУ АН EARR, ЈЕ о {ЧЭН УУ 





(a) 原 图 lena.bmp (b) 图 (a) 经 过 灰 度 膨胀 (c) 图 Са) 经 过 灰 度 腐蚀 
411.36 ЖР К-ТЕ ЖЛЕ ph 
2. Visual C++ 实现 


利用 Visual С++5Е Zk J BHA ИН ШУН < Xu 
HH F. 


J ŽE E K >F >= >= K K >F K K KK K K K K K 


void CImgProcess::GrayErode(CImgProcess* pTo, int nTemp 

H, int nTempW, int nTempMY, int nTempMX, int** se) 

功能 : IRIZ BMZ JA h 

注 : 只 接受 平坦 的 结构 元 素 

参数 : CImgProcess* pTo: 目标 图 像 的 CImgProcess 指针 
int nTempH: 模板 的 高 度 
int nTempW: 模板 的 宽度 
int nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( <= iTempH - 1) 
int  nTempMX: 模板 的 中 心 元 素 X 坐 标 ( <= iTempW - 1) 
int **se: 结构 元 素 

返回 值 : Ж 

ЖЕЕ ЖЕЛЕ PE SE КК ЖЕКЕ КК / 

void CImgProcess::GrayErode(CImgProcess* pTo, int nTemp 

H, int nTempW, int nTempMY, int nTempMX, int** se) 

l 


// 循环 变量 
int i, j, k, l; 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


for(i=nTempMY;i<nHeight - nTempH + nTempMY + 1;1++) 
l 
for(j=nTempMX;j<nWidth - nTempW + nTempMX +1;j++) 
{ 
BYTE minVal = 255; // 局 部 最 小 值 
for(k=0;k<nTempH;k++) 


{ 
for(l=0;1<nTempW;l++) 
{ 
if( ѕе[к|[1] == 1 ) 
{ 
// Wai - nTempMY + кіт, j - nTempMX + 
ІЛ НУК 


ВҮТЕ gray = GetGray(j-nTempMX+1, i-nTempMY 
+K ) ; 


// 求 局 部 最 大 值 
if( gray < minVal ) 
minVal = gray; 
} 
}//1 
}//k 


pTo->SetPixel(j, i, RGB(minVal, minVal, minVal)) 


y// for j 
}//for i 





Х| Н GrayErode() РЁ #2120 JE ДД ШШ) 5с 7 | 
做 封 站 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView::OnMorphGrayerode 0 中 ， 其 中 调 
H СтауЕгоае() Р 11 тА К. 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 GrayErode() 实 现 灰 度 腐蚀 
imglnput.GrayErode(&imgOutput, 3, 3, 1, 1, se); 
// 这 里 se 是 一 个 int ** 指 针 ， 表 示 结 构 元 系 。 这 里 采用 了 3*3 原 点 位 


于 中 心 的 结构 元 系 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程 序 运行 时 会 辜 出 对 话 框 ， 要 求 用 户 设置 
结构 元 隶 。 访 者 可 以 通过 光盘 中 示例 程序 DIPDemo 
中 的 采 早 命令 “形态 学 变换 ЛК ВЕ ЈИЕ АРН 
效果 。 


11.4.3” 灰 度 开 、 闭 运算 及 其 实现 
1. 理论 基础 


类 似 于 二 值 形 态 和 学 ， 可 以 在 灰 度 腐蚀 和 脱 上 胀 的 
H EENKEER. KEAS RWE IAK 


度 开 运算 : 使 用 结构 元 系 s H EAF KERT 
运算 ， 记 作 f。s о 可 表示 为 : 


f ° SS (fe S ) ES 
(11-12) 


。 灰 度 财 运算 : 使 用 结构 元 系 s Ж КЖ ETARE 
闭 运 算 ， 记 作 fs。 可 表示 为 : 


[+5=([®5)ө$5 
(11-13) 


假设 有 一 个 球形 的 结构 元 又 s ， 开 运算 相当 于 
推动 球 沿 着 曲面 的 下 侧面 深 动 ， 使 得 球体 可 以 紧 贴 
大 下 侧面 来 回 移动 ， 下 到 移动 位 置 履 新 了 整个 下 侧 
面 。 此 时 球体 的 任何 部 分 能 够 达到 的 最 高 点 构成 了 
开 运 算 f.s 的 曲面 ， 而 闭 运 算 则 相当 于 让 球体 紧 贴 
在 曲面 的 上 表面 滚动 ， 此 时 球体 任何 部 分 所 能 达到 
的 最 低 点 即 构成 了 闭 运算 As 的 曲面 。 网 11.37 形 象 
地 说 明了 这 一 过 程 ， 图 11.37 (а) 为 图 像 中 的 一 条 
水 平 像素 线 ; 图 11.37 (b) 和 图 11.37 (d) 分 别 给 
出 了 球 紧 贴 着 该 像素 线 的 下 侧 和 上 侧 滚 动 的 情况 ; 


10 11.37 (с) 10411.37 (е) 则 展示 了 演 动 过 程 
中 球 的 最 高 点 形成 的 曲线 ， 它 们 分 别 是 开 、 闭 运算 
的 结 


(a) 图 像 中 的 一 条 水 平 扫 描 灰 度 线 
人 


人 人 人 (у Г; 
(b) НТК ZS Mh H Ж F NJ J 


(c) 开 运 算 结 果 


° O JV С 


(d) Й НК Ят HH zh ЕИ J 


和信 


(e) 团 运 算 结 果 
411.37 ” 灰 度 开 、 闭 运算 示意 图 


2. MATLAB 实 现 


1 Himopen0()#llimdilate()|rJ Ë% F] LAXTAK E | 
HIA Ийе, ШЕЕ ЖЛЕ ИКЭ, X 
里 吏 不 再 专门 介绍 了 。 


在 实际 应 用 中 ， 开 操作 和 彰 稼 用 于 去 除 那些 相对 
FAAS 而 言 较 小 的 高 灰 度 区 域 (球体 深 不 上 
去 ) ， 而 对 于 较 大 的 亮 区 域 影 啊 不 大 〈 球 体 可 以 滚 
EE) 。 虽 然 首先 进行 的 灰 度 腐蚀 会 在 去 除 图 像 细 
节 的 同时 使 得 整体 灰 度 下 降 ， 但 随后 的 灰 度 脱 胀 又 
会 增强 网 像 的 整体 亮度 ， 因 此 图 像 的 整体 灰 度 基本 
保持 不 变 ; m AEE E H TER BRS p WR 
a ERER AEREE Am 
所 示 。 





(а) 图 11.31 (a) 的 开 运 算 处 理 图 像 (b) 1131 (a) 的 闭 运 算 处 理 图 像 


411.38 KEF, ИЛЛ 


3. Visual C++ 实现 
° KEFR 


利用 Visual C++ 实现 灰 度 开 运算 的 相关 代码 如 
下 所 示 。 


JY i T 


void CImgProcess::GrayOpen(CImgProcess* pTo, int nTempH 

, int nTempW, int nTempMY, int nTempMX, int** se) 

功能 : JK] Fie 9 

注 : 只 接受 平坦 的 结构 元 素 

参数 : CImgProcess* pTo: 目标 图 像 的 CImgProcess 指针 
int nTempH: 模板 的 高 虐 
int nTempW: 模板 的 宽度 
int nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( <= iTempH - 1) 
int nTempMX: 模板 的 中 心 元 素 X 坐 标 ( <= iTempW - 1) 
int **se: 结构 元 素 

BRE: Ж 


POK KE TOP TT TTT TT 


void CImgProcess::GrayOpen(CImgProcess* pTo, int nTempH 
‚ int nTempW, int nTempMY, int nTempMX, int** se) 
l 


pTo->InitPixels(255); 


GrayErode(pTo, nTempH, nTempW, nTempMY, nTempMX, se 
); 

CImgProcess tmpImg = *pTo; // fJ wR 

tmpImg.GrayDilate(pTo, nTempH, nTempW, nTempMY, nTe 
mpMX, se); 
} 





ХІ) СгауОреп() р 27 SE JJI Zk БЕ) УЕ S 51145 
=J2#+EDIPDemo l H ЧА AI K 5 уоіа 
СрІРретоУіеу::ОпМогрћСгауореп 0 中 ， 其 中 调用 
СгауОреп() 6 ЧИКЕ А Br HH F ç 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 Gray0pen() 实 现 灰 度 开 
imgInput.GrayOpen(&imgOutput, 3, 3, 1, 1, se); 
// 这 里 se 是 一 个 int ## 指 针 ， 表 示 结 构 元 素 。 这 里 采用 了 3#3 原 点 位 


于 中 心 的 结构 元 素 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设 置 
结构 元 隶 。 谈 者 可 以 通过 光盘 中 示例 程序 DIPDemo 
中 的 腔 单 命令 “形态 学 要 换 一 灰 度 开 ? 来 观察 处 理 效 
Ж. 


IKR зая 


利用 Visual C++ IZK JE Ие Sa AFERRA 
В. 


ао ооо 


void CImgProcess::GrayClose(CImgProcess* pTo, int nTemp 
H, int nTempW, int nTempMY, int nTempMX, int** se) 


功能 : К) Эг 


Е: НЗ ЗЕН ДЈА J ú 
参数 : CImgProcess* pTo: 目标 图 像 的 CImgProcess 指针 


int nTempH: 模板 的 高 虐 
int nTempW: 模板 的 宽度 
int nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( <= iTempH - 1) 
int  nTempMX: 模板 的 中 心 元 素 X 坐 标 ( <= iTempW - 1) 
int **se: 结构 元 素 
返回 值 ;: Ж 
下 
void CImgProcess: :GrayClose(CImgProcessk pTo, int nTemp 
H, int nTempW, int nTempMY, int nTempMX, int** se) 
l 
pTo->InitPixels(255); 


GrayDilate(pTo, nTempH, nTempW, nTempMY, nTempMX, s 
e); 

CImgProcess tmpImg = *pTo; // Z TER BKA 

tmpImg.GrayErode(pTo, nTempH, nTempW, nTempMY, nTem 
pMX, se); 
} 


利用 GrayClose() 函 数 实现 灰 上 度 闭 的 完整 示例 被 
封 乡 在 DIPDemo 工 程 中 的 视图 美国 数 void 
CDIPDemoView::OnMorphGrayclose 0 中 ， 其 中 调 
用 GrayClose0 国 数 的 代 但 上 请 断 如 下 。 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 GrayClose( ) 52125 8 Й] 
imgInput.GrayClose(&imgOutput, 3, 3, 1, 1, se); 


// 这 里 se 是 一 个 int ** 指 针 ， 表 示 结 构 元 素 。 这 里 采用 了 3*3 原 点 位 
于 中 心 的 结构 元 系 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设置 
结构 元 素 。 读 者 可 以 通过 光盘 中 示例 程序 DIPDemo 
中 的 菜单 命令 "形态 学 变换 _“ 灰 度 闭 来 观察 处 理 效 
H, 


11.4.4 11827 (top-hat) 及 其 实现 
1. 理论 基础 


作为 灰 度 形态 学 的 重要 应 用 之 一 ， 这 里 学 习 一 
种 韭 均 色光 照 问 题 的 解决 方案 一 一 巩 幅 变换 技术 
(top-hat) 。 图 像 f НУ ЛЛА 6 28 h 定义 为 图 像 f 与 图 
Ее а ж, Ју: 


һ= (Р) 
(11-14) 


[7111.111] ЖРК —— ЛАА АР 
换 。 


411.39 (а) 是 MATLAB 中 自 带 的 米粒 图 像 
rice.png， 相 对 珊 灰 度 的 米粒 分 散 于 整体 的 暗 背 景 
中 ， 注 意 到 图 像 上 部 分 的 背景 明显 要 比 下 部 的 背景 
区 域 之 一 些 ， 这 正 是 由 成 像 时 不 均匀 的 光照 引起 
的 。 操 作者 希望 能 够 通过 闷 值 化 把 物体 (米粒 ) 与 
背景 分 离开 来 ， 从 而 进一步 研究 物体 的 性 质 ， 如 个 
数 和 位 置 关 系 等 。 


然而 ， 在 图 象 整体 灰 上 度 不 均 的 情况 下 ， 下 接 对 
411.39 (а) 进行 闽 值 化 将 难以 得 到 满意 的 效果 ， 
411.39 b) 中 给 出 了 用 目 适 应 了 最 优 国 值 法 进行 分 
割 的 结果 ， 可 以 看 到 展 部 的 一 些 米粒 分 割 效 果园 
差 。 为 了 理解 起 来 更 加 直观 ， 在 图 11.39 (с) 中 给 
出 了 图 像 f 的 三 维 可 视 化 效果 ，f 了 中 的 米粒 对 应 于 图 
11.39 (c) 图 中 一 个 个 “山峰 >”， 注 意 到 这 些 “ 山 
峰 ” 位 于 一 个 “斜坡 ”上 上， 换言之 ， 它 们 的 “地 基 ” 并 不 
这 正 是 由 中 不 均匀 的 背景 造成 


通过 运用 合适 的 结构 元 系 s 与 1 进行 开 运 算 可 以 
消除 这 些 峰 值 。f 中 的 米粒 都 具有 近似 大 小 ， 因 此 
只 要 选择 直径 比 米粒 的 短 轴 稍 大 的 圆 形 结构 元 际 束 
可 以 达到 目的 。 图 11.39 (d) 给 出 了 采用 半径 为 15 
的 圆 形 结构 元 又 与 f/ 进 行 开 和 运算 后 得 到 图 像 的 三 维 
可 视 化 效果 。 想 象 水 平地 托 着 一 个 圆 盘 从 网 
11.39 (c) 中 曲面 的 下 侧 走 过 ， 这 个 过 程 中 始终 让 


HAME Н ТА НЧ FM), 22И е тер SA J Rk. BS HH [HI 
Wz 81139 (d) FAYH o ЕНИН K ute 
сс 这 实际 上 得 到 了 一 个 消 际 了 峰值 的 
ARH. ŒA, MERA PRELIM 
ыы еч 比较 均匀 的 米粒 图 像 图 

11.39 (e) ， 其 三 维 可 视 化 效果 如 图 11.39 (f) 所 

不 ， 这 些 “| 峰 ”已经 基本 处 于 同一 高 上 度 。 图 

11.39 (g) 给 出 了 图 11.39 (е) 经 过 灰 度 拉 伸 的 效 

H; 图 11.39 (h) 是 对 图 11.39(g) 中 的 图 像 进行 

闵 值 分 割 的 结果 ， 己 经 非常 理想 了 ， 


相应 的 MATLAB 代 码 如 下 。 


>> I = imread('rice.png'); 
>> subplot(2, 4, 1), imshow(I, [1]);%2111.39 (a) 
>> thresh = graythresh(I) ХАЛЕ BHE 
thresh = 

0.5137 
>> Ibw = im2bw(I, thresh); 
>> subplot(2, 4, 2), imshow(Ibw, []);%2111.39 (b) 
>> subplot(2, 4, 3), surf(double(I(1:8:end,1:8:end))),z 
lim([@ 255]),colormap gray;% 显 示 I 的 3 维 可 视 化 效果 ，(c) 图 
>> 
>> bg = imopen(I,strel('disk' ,15));% 半 径 为 15 的 圆 形 结构 元 
素 进 行 灰 度 开 运算 提取 背景 曲面 
>> subplot(2, 4, 4), surf(double(bg(1:8:end,1:8:end))), 
zlim([6 255]), colormap gray; % 显 示 背 景 曲面 的 三 维 可 视 化 效 
果 ， 图 11.39 (d) 
>> 
>> Itophat = imsubtract(I, bg); 118173 
>> subplot(2, 4, 5), imshow(Itophat); %#*l|%11.39 (е) 


>> subplot(2, 4, 6), surf(double(Itophat(1:8:end,1:8:en 
d))),zlim([0 255]); % 显 示 顶 帽 变换 图 像 的 三 维 可 视 化 效果 

>> 12 = imadjust(Itophat);% 对 比 度 拉 伸 

>> subplot(2, 4, 7), imshow(I2); % 得 到 图 11.39 (f) 

>> 

>> thresh2 = graythresh(I2) НЕЛЕ ИН 

thresh2 = 


0.4843 
>> Ibw2 = im2bw(I2, thresh2); %# 11.39 (g) 
>> subplot(2, 4, 8), imshow(Ibw2); % 得 到 图 11.39 (h) 





上 述 程序 的 运行 绪 末 如 图 11.39 上 所 示 。 








| М. k 
(a) ЖЕЎ 


ET” 


(b) А са» ER eeit A iñ e {Н ДЕНИ 


(c) Е РАУ пр Я 


IN 


(项 由 变换 图 像 /- (s) 的 三 维 可 视 化 效果 (g) 将 图 像 广 (res) 对 比 度 拉 介 (h) 对 项 由 变换 后 图 像 进行 二 值 化 


411.39 ” 顶 帽 变换 处 理光 照 不 均 的 图 像 


2. Visual C++ 实现 


利用 Visual C++ 实现 项 帽 变 换 的 相关 代码 如 
F. 


{ЕЛЕЕ For TT Ey Et 


void CImgProcess::Tophat(CImgProcess* pTo, int nTempH, 

int nTempW, int nTempMY, int nTempMX, int** se) 

功能 : 顶 帽 变换 

注 : 只 接受 平坦 的 结构 元 素 

参数 : CImgProcess* pTo: 目标 图 像 的 CImgProcess 指针 
int nTempH: 模板 的 高 虐 
int nTempW: 模板 的 宽度 
int nTempMY: 模板 的 中 心 元 素 Y 坐 标 ( <= iTempH - 1) 
int nTempMX: 模板 的 中 心 元 素 X 坐 标 ( <= iTempW - 1) 
int **se: 结构 元 素 

BRE: Ж 

k uu t KS КОКЕ / 

void CImgProcess::Tophat(CImgProcess* pTo, int nTempH, 

int nTempW, int nTempMY, int nTempMX, int** se) 


l 
GrayOpen(pTo, nTempH, nTempW, nTempMY, nTempMX, se) 
; REFER 


*pTo = (*this) - (*pTo); // 项 幅 变 换 ( 原 图 像 减 去 开 运 算 
Ж) 
} 





А) Н Торһац) р SE EN ПА AE FR У së Жл 1 48 
дЫ] Ж ТЕШРО ето LIEF НУХ ЕРА уоіа 
CDIPDemoView::OnMorphTophat 0 中 ， 其 中 调用 
Tophat( р 2871 A Br HH F o 





// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// 调 用 Tophat() 实 现 项 帽 变换 


imglnput.Tophat(&imgOutput, 3, 3, 1, 1, se); 
// 这 里 se 是 一 个 int *# 指 针 ， 表 示 结 构 元 素 。 这 里 采用 了 3*#3 原 点 位 
于 中 心 的 结构 元 素 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


—u 





上 述 程序 运行 时 会 弹出 对 话 框 ， 要 求 用 户 设 置 
结构 元 系 。 读 痢 可 以 通过 光盘 中 示例 程序 DIPDemo 
中 的 采 早 命令 “形态 学 变换 一 顶 帽 变 换 ”* 来 观察 处 理 
К. 


小 结 


在 本 章 中 ， 介 绍 了 形态 学 的 基本 概念 并 学 习 了 
多 种 彰 见 的 形态 学 算法 及 其 典型 应 用 。 合 理 运 用 这 
些 技 术 能 够 帮助 操作 者 从 图 像 中 提取 感 兴 趣 的 特 
ПЕ, ЖЕЛШ [Н ЖО?) ЙЛ ЕНЕ Л ДЕ 
合 在 一 起 ， 为 最 终 得 到 能 够 直接 用 于 图 像 识 别 的 数 
值 或 向 量 特征 铺 平 了 道路 。 事 实 上 ， 在 下 一 章 中 还 
Ee 
岭 算 法 。 


OW: 对 个 的 音义: 东 个 图 月 处 理 系统 用 使 件 实现 
ГЈ а и, ДАДА ВИКАЛЕ, E 


PAFI ИА a AKI у. 


第 12 章 BATE 

图 像 分 割 是 指 将 图 像 中 具有 特殊 意义 的 不 同 区 
域 划 分 开 来 ， 这 些 区 域 是 互 不 相交 的 ， 每 个 区 域 满 
足 灰 度 、 纹 理 、 彩 色 等 特征 的 某 种 相似 性 准则 。 图 
像 分 割 是 图 像 的 分 析 过 程 中 最 重要 的 步骤 之 一 ， 分 
割 出 的 区 域 可 以 作为 后 续 特 征 提 取 的 目标 对 象 。 
本 章 的 知识 和 技术 热点 


(1) ЖР Sobel, Prewitt Roberts R. T 
的 边缘 检测 


(2) LoG 边 缘 检 测算 法 

(3) Canny 边 缘 检 测算 法 

(4) Hough A H RTM 

(5) BREN HIN 

(6) EF X EI 7 
本 草 的 典型 案例 


(1) 基于 LoG 和 Canny 算 子 的 精确 边 绿 检 冲 


(2) 基于 Hough 变 换 的 直线 检测 
СЗ) 图 像 的 四 文 树 分 解 


121 ”图像 分 割 概 述 


图 像 分 割 的 方法 和 种 类 有 很 多 ， 有 些 分 割 拭 法 
可 以 直接 运用 于 大 多 数 图 像 ， 而 为 一 些 则 只 适用 于 
特殊 类 列 的 图 像 ， 要 视 其 体 情况 来 决定 。 一 般 灯 用 
的 方法 有 边 绿 检测 (Edge Detection), AIER ER 
(Edge Tracing) 、 区 域 生 长 (Region Growing 
) 、 区 域 分 离 和 聚合 等 。 


图 像 分 割 算法 一 般 基 于 图 像 灰 度 值 的 不 连续 性 
或 其 相似 性 。 不 连续 性 是 基于 图 像 灰 上 度 的 不 连续 变 
化 分 割 独 像 ， 例 如 图 像 的 边缘 ， 有 边缘 检测 、 边 界 
跟踪 等 算法 ; 相似 性 是 依据 事先 制定 的 准则 将 图 像 
分 割 为 相似 的 区 域 ， 如 国 什 分割、 区 域 生 长 等 ， 关 
系 如 图 12.1 所 示 。 


边 绿 检测 
图 像 的 不 连续 性 边界 跟踪 


Hough 变换 
图 像 分 割 


区 域 生长 
图 像 的 相似 性 区 域 分 农 与 合并 


{Н 2) Ж 
4121 图像 分 割 的 分 类 


图 像 分 割 在 实际 的 科学 研究 和 工程 扩 术 领域 中 
有 着 广泛 的 应 用 。 在 工业 上 ， 应 用 于 丰茂 分 析 、 无 
接触 式 检测 、 产 品 的 精度 和 纯度 分 析 等 ， 生 物 医学 
上 ， 应 用 于 计算机 断层 图 像 CT、X 光 透 钢 、 核 磁 夫 
振 、 病 毒 细 胞 的 目 动 检 训 和 识别 等 ;交通 上 ， 应 用 
TEAU EPRD ERES BI ENL 
WAME MANA AEE ВИА 
领域 都 有 看 广泛 的 应 用 。 
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图 像 的 边缘 症 图 像 的 最 基本 特征 102 3н 
图 像 中 周围 像 系 灰 度 有 阶 跃 变 化 或 屋 项 变化 的 那些 
№ а, ШОКАН 导数 较 六 或 极 大 的 地方 。 图 像 


Ja EH ДУ АРЛ 8 БЕШ Г ТЕЕ 2 K SY ITS 
(Е. 


17] Ze u J| е АИ РЕН 和 计算 机 视觉 中 的 基本 
ШИ, AARM Н ВЧ 18: F u: Ж 
化 明显 的 点 。 本 书 曾 在 5.5 节 中 讨论 了 一 些 可 以 用 于 
增强 边 绿 的 图 像 锐 化 方法 ， 本 介绍 如 何 将 它们 用 
FAZEM; 此 外 ， 还 将 学 习 一 种 专门 用 于 边 绿 检 
测 的 Canny 算 子 。 


12.2.1 边缘 检测 概述 

边 绿 检测 可 以 大 幅 撒 地 减少 数据 量 ， 并 有 旦 别 除 
那些 被 认为 不 相关 的 信息 ， 保 留 图 像 重 要 的 结构 属 
性 。 
1. 27У | HS E 4212 IE 


边缘 检测 的 步骤 如 图 12.2 所 示 。 


锐 化 小 波 
平滑 图 像 锐 化 图 像 


8 经 
aE р 


波 定 
原始 图 像 边缘 图像 "一 


图 12.2 ”边缘 检测 


(1) 平滑 滤波 : 由 于 梯度 计算 易 受 噪 声 的 影 
响 ， 因 此 第 一 步 是 用 滤波 去 除 噪声 。 但 是 ， 降 低 噪 
声 的 平滑 能 力 越 强 ， 边 界 强度 的 损失 越 大 。 


(2) WI: N [УЙЛ ЯК, ЛИЛЕ Л 
扩 邻 域 中 灰 度 的 变化 。 钢 化 操作 加 强 了 存在 有 意义 
的 灰 度 局 部 变化 位 置 的 像 妹 氮 。 


(3) 边缘 判定 : 在 图 像 中 存在 许多 梯度 不 为 
零 的 点 ， 但 是 对 于 特定 应 用 ， 不 是 所 有 点 都 有 意 
义 。 这 就 要 求 操作 者 根据 具体 情况 选择 和 去 除 处 理 
点 ， 具 体 的 方法 包括 二 值 化 处 理 和 过 零 检测 等 。 


(4) 边缘 和 连接: 将 则 肠 的 边 绿 连 接 成 为 有 意 


义 的 完整 边 绿 ， 同 时 去 除 假 边缘 。 主 要 方法 是 
Ноцпраһ 1% 


2. AMTRAK 


ЖЫР; HJ Z L НУ Pty УРУЯ 6: 基于 但 找 
НЯ M12E J SP SE ЖАНИ?» REZI, LA 
Canny 201195. 14115152. 


(1) ЖТ ЖН) ik ei {4% Ч И 
ЖЕН ве KB Rise SB ЖК ЙЛ Т, Шр 14 32 ЎР 
ЕЕЕ ње ДИ 27 6], ЖАКТ ЙГ ХОЛ ЖУ 
ШЕЕ: 


(2) ЖТА RR IJ AEL p qk КЖ Сї 
а SPOR OK STA P, Ba e h PE u Bi E д Pk 
А ЧЕКУ а, ж НЛ 
RITI EIA o 


基于 一 阶 导 数 的 边 绿 检测 算 子 包括 Roberts 算 
子 、Sobel 算 子 、Prewitt 算 子 等 ， 它 们 都 是 樟 度 算 
子 ; 基于 二 阶 导 数 的 边缘 检测 算 子 主要 是 高 斯 - 拉 
普 拉 斯 边缘 检测 算 子 。 本 节 将 在 12.2.2 小 节 中 对 它 
们 进行 介绍 。 


12.2.2 ”种 用 的 边 绿 检测 得 于 


1. RRT 
儿 个 最 第 用 的 梯度 算 子 的 模板 如 图 12.3 所 示 。 


(a) Roberts 模 板 


-1 -2 -1 -1 0 1 
0 0 O -2 0 2 
I 2 1 -1 0 1 
(b) KF (£) MZA (A) 的 Sobel 模 板 
-1 -1 -1| [-1 01 
0 0 0| |-1 01 
I 1 1| |-1 01 


(с) КЁ (Ж) MEEA (A) 的 Prewitt 模 板 
图 12.3 ”梯度 算 子 模板 


Robers R FAH HARENA T IRAIZ, a 
ПВЛ Ва, BERA 66002102, E H J 
图 像 没 经 过 平 清 处 理 ， 因 此 不 具备 抑制 噪声 的 能 
s: PL TAEA REIK Ж H. los pa b W BNA 27 HE: 
Hf. 


Sobel y MPrewit H TAE / ИЕ, ЖН 
` FX G W JM EB Р, Ха ШИИ? 2 
算 ， 上 所 不 同 的 是 平 请 部 分 的 权 值 有 些 甜 异 ， 因 此 对 
EHA EMME REJ, MART EHRM] A 
Rh EEBS. BAIANA fJ Г 
К, HAS Jl] rH ЛЖ 2; Ш Z I В ç 


2. Л-ТИ 


在 5.5.3 小 节 已 经 介绍 了 拉 普 拉 斯 算 子 ， 但 是 由 
于 它 是 一 个 二 阶 导数 ， 对 噪声 具有 无 法 接受 的 敏感 
性 ， 而 且 其 幅 值 会 产生 双边 缘 ， 另 外 ， 边 缘 方向 的 
不 可 检测 性 也 是 拉 普 拉 斯 算 子 的 缺点 之 一 ， 因 此 ， 
一 般 不 以 其 原始 形式 用 于 边缘 检测 。 


为 了 鸣 补 拉 普 拉 斯 算 子 与 生 俱 来 的 缺 附 ， 美 国 
学 首 Marr 皖 出 了 一 种 得 法， 在 运用 拉 彰 拉 斯 得 本 之 
六 一 般 移 进行 高 斯 低 通 滤 站 ， 可 表示 为 : 


V [Glz y) ж f(r, vy) 


(12-1) 


REP E, y ABZ, G, y) тт, Ж 
不 为 : 








(12-2) 


ҖЕН, охе ИЕ. H r ТРА А Я В - I 
图 像 ， 图 像 模糊 的 程度 古 由 o 决定 的 。 


由 于 在 线性 系统 中 疮 积 己 做 分 的 次 序 可 以 区 
换 ， 由 式 〈12-1) 可 得 下 式 : 


У? Ст, у) ж f(z,9)] = VG(z,y) * fley) 


(12-3) 


т (12-3) 说 明了 可 以 先 对 高 斯 算 子 进行 微分 
ја, УИ (х, y ER, АСКАРИ РЕ 
运用 拉 普 拉 斯 算 子 之 六 首先 进行 高 斯 低 通 滤波 。 


计算 式 〈12-2) 的 二 阶 侦 寻 ， 如 下 去 所 示 。 




















F Gir. у) 1 z |ы 12 +12, 
Ə moto Ер Iy? | 
(12-4) 
PGy) 1 fy КБ 12 +32 | 
Əy то Е шш 
(12-5) 








V Ст. у) = = |. 


TU i 


(12-6) 


式 (12-6) 称 为 高 斯 - 拉 普 拉 斯 拭 子 〈Laplacian 
of а Gaussian) ， 何 称 LoG 算 子 ， 也 称 为 Marr 边 绿 检 
测算 子 。 


应 用 LoG 算 于 时 ， 凯 斯 印 数 中 标准 和 关 参 数 ca 的 
选择 很 关键 ， 对 图 像 边缘 从 测 效 来 有 很 大 的 影 啊 ， 
对 于 不同 图 像 应 选择 个 同 参 数 。 


LoG 算 子 殉 服 了 拉 普 拉 斯 拭 子 抗 噪声 能 力 比较 
在 的 钻 操 ， 但 十 在 撮 制 噪声 的 同时 也 可 能 将 原 有 有 的 
比较 尖锐 的 边缘 也 平 请 挥 了 了 ， 造 成 这 些 僚 够 边缘 无 
法 个 检测 到 。 


常用 的 LoG 算 子 是 5x5 的 模板 ， 如 图 12.4 所 示 。 


0 0 -1I 0 0 


图 12.4 LoG 算 子 


在 5.5 广 曾 指 出 拉 普 拉 斯 算 子 的 啊 应 会 产生 双边 
Ж, AER Н ВТА 3 892543, ЖЕЛЕ) ЛЕ 
НЕ ТЕКТЕ 2 J 2222 SZ PE Ji Желк 1/7 Ж 
(参见 5.5.4 小 节 ) 。 


3. Canny 边 绿 检 测算 子 
前 面 介 绍 的 几 种 都 是 基于 微分 方法 的 边缘 检测 


算法 ， 它 们 都 只 有 在 图 像 不 含 噪声 或 者 首先 通过 平 
滑 去 除 噪声 的 前 提 下 才能 正常 应 用 。 


在 图 像 边 缘 检 调 中 ， 抑 制 噪声 和 边缘 糊 确 定位 
挟 无 法 同时 满足 的 ， 一 些 边缘 检测 算法 通过 平滑 泪 
溉 去 除 噪声 的 同时 ， 也 增加 了 这 绿 定 位 的 不 硝 定 
性 ;而 握 局 边缘 从 测算 子 对 边缘 的 敏感 性 的 同时 ， 
也 提高 了 对 噪声 的 敏感 性 。Canny 算 子 力图 在 抗 品 
声 干 扰 和 狂 硝 定位 之 间 寻 求 最 佳 折 中 方案 。 


Саппу 2272509175 8:947 7707, peh A ЗА 
ИЕЛІ. 


(1) 信 噪 比 准则 ;对 边缘 的 错误 检测 率 要 尽 
可 能 低 ， 尽 可 能 检测 出 图 像 的 真实 边缘 ， 且 尽 可 能 
减少 检测 出 虚假 边缘 ， 获 得 一 个 好 的 结果 。 在 数学 
上 ， 就 是 使 信 噪 比 SNR 尽量 大 。 输 出 信 品 比 越 大 ， 
错误 率 越 小 。 


三， (т{—т)](т)ат 








SNR = 


по 2 f2(a)a> ° 
(12-7) 


其 中 ，f (x ) 征 边 寞 为 [-o ，@ JA С HPJ 
脉冲 啊 应 ，G (x) 代表 边缘 ，no хта ТЕ pa НУУ) 
方 根 。 


(2) 定位 精度 准则 : EM iH Ju Zc 2 Пп] ВЕ 


Бе 8.25102. W Eneas RKE РА ЖИА (x) 使 
z (12-8) 中 的 Loc 尽量 大 。 


[Т“@'(—т)}'(т)ат 








Loc = 


д! f Р? (ж) i 
(12-8) 


Жин, өбө, re) ДЮ С Cx) f (x) HJ 
5. 


(3) 单 边缘 啊 应 准则 : 对 同一 边缘 要 有 低 的 
Па И, ВОХР А ЛУ йй 
ХУ ЭЛ Z< 5 HJ ХИН Z ТАЈ НУР ЕН ТА 29: 


| isa F2fzydz š | 
Шаң q es z kW 


SA f" (z)dr 








(12-9) 
因此 在 2W 宽度 内 ， 极 大 值 的 数目 为 : 
(12-10) 


А, Н |е ГК, WEE ХИА НЧА 


Sii 


数 。 


A SZINEN, FERED IVE A H i a 
FEINZ RIRE [, ERa P| H тЫ; 
АТУ 025280217. 


Саппу227 ZZ ЙИ А22 9 ЕН З | A b 
ВЕ — х MJ Gauss E 11Р Е, AJ HHE 
极 信 抑制 扩 术 进行 处 理 得 到 了 最 后 的 边 绿 图像。 其 步 
又 如 下 。 


(1) 用 局 斯 滤波 货 平 请 图 像 。 这 里 ， 利 用 一 
A Sa ЕА ТРАН (х,у): 


2 2 

т“ HY, 

=] 
От“ 





H(z, у) = ехр(— 


(12-11) 
Gir y) = fir, y} ж Ніж, у) 


(12-12) 


RP, рох,у) RAAI 


(2) Н Мн НА REAR y] Pr E PJ lB: 
值 和 方向 。 利 用 一 阶 委 分 登 积 模板 : 


一 一 | 1 —1 
и = |3 ш m=|1 了 | 
yiliz, y) = flz.wu)* (х,у) palT, y) = fiz, у) ж HaT, уу) 


fFF: 


5 
(12-13) 
77 18]: 


10202,2) 


12,3) 





@„ = tan 


(12-14) 


(3) ХР НИЕ ЧЕ ХИВ ЗИТ]. OCT S 
|а А JEF JE JS РЕ, ЕЈ 2, A 
ИЖ ВЯ А И Б е ДЕ) а, WAREKE, В: 
非 局 部 极 大 信 点 年 零 以 得 到 细 化 的 边缘 。 


如 网 12.5 所 示 ，4 个 而 区 的 标号 为 0 到 3， 对 应 
3x3 邻 域 的 4 种 可 能 组 合 。 





12.5 ЧЕХІВ] 


在 每 一 点 上 ， 邻 域 的 中 心 像素 M 与 沿 着 梯度 线 
的 两 个 像素 相 比 。 如 果 M 的 梯度 值 不 比 沿 梯度 线 的 
两 个 相 邻 像素 梯度 值 大 ， 则 令 M =0. 


(4) 用 双 国 人 算法 检测 和 连接 边 绿 。 使 用 两 
NAET AT (Ti<T2) ， 从 而 可 以 得 到 两 个 国 
#17 N 1 [i,j] 和 N 5 [i,j]。 由 于 N > [i,j NEH 
高 网 值得 到， 因而 含有 很 少 的 假 边缘 ， 但 有 间 哮 

(不 财 合 ) 。 双 国信 法 要 在 N， [i , j HE uU ZX E 
成 轮廓 ， 当 到 达 轮 廓 的 站 点 时 ， 访 算法 吏 在 NT [i,j 
] 的 8 邻 点 位 置 寻 找 可 以 连接 到 轮 廊 上 的 边缘 ， 这 
样 ， 算 法 不 断 地 在 N 1 Li , 门 中 收集 边缘 ， 直 到 将 N о 
[i , 门 连 接 起 来 为 止 。T > 用 来 找到 每 条 线段 ，T 1 用 
来 在 这 些 线段 的 两 个 方 回 上 延伸 寻找 边 毕 的 断 玖 


12.2.3 MATLAB 实 现 


MATLAB 的 IPT 函数 edge0 可 以 方便 地 实现 
12.2.2 小 节 的 几 种 边缘 检测 方法 ， 该 函数 的 作用 是 
检测 丈 度 网 像 中 的 边 绿 ， 并 返回 一 个 市 有 这 缘 信息 
WERS, Жл, НЕХ 
中 的 边缘 部 分 。 


1. ETR RT W a 


1E H edge) A 0917 ЛЕА Л Ze S: lI 
的 调用 语法 如 下 。 


BW = еЯре(І, уре, Еһгеѕһ,аігесііоп, ? поћіппіпе') 


参数 说 明 : 


。 林 是 需要 检测 边缘 的 输入 图 像 ; 
° type #7 ЯНО, АИВ 1912.177 
ANE 


12.1 PRATHER 


合法 取 值 梯度 算 子 





W |19017 7 | 

° thresh ERUKE ИЕ >, AEI ZKE IK E R] 
ERIZK о ЕЛУ И 21], RRE л =ë RE Е 
[1] ЖЕЛ? НР ИН; 

° direction JRE f BAFER BRAA |6], 
edge(0 KRO% H 91аігесіоп 中 指定 方 回 的 边 
绿 ， 其 合法 取信 如 表 12.2 所 示 ; 


212.2 ”边缘 方 癌 的 合法 取信 表 


合法 取 值 10272 16] 





。 吕 选 参 数 “nothinning ”, АХЕН н] Pil pipi 
绿 细 化 算法 来 加 快 算法 运行 的 速度 。 在 默认 时 
候 ， 这 个 参数 是 *thinning”， 即 进行 边缘 细 化 。 

[Н]: 


° BW 为 返回 的 二 值 图 像 ， 其 中 0 СКЕ) 为 育 
景 ，1 (日 色 ) 为 边缘 部 分 。 


2. аА Rl tf ВЈ ЖУ II 


1 H еаве() K ZOETE J i B- Tu Er u Br et fo HJ 
过 绿 检 测 的 调用 语法 如 下 。 


BW = edge(I,'log' ,thresh,sigma) 


参数 说 明 : 


° | F Hb EE J ENA; 

第 2 个 参数 为 "log” 表 示 采 用 高 斯 - 拉 普 拉 期 算 

Ý; 

thresh PURE REAA, ЕЕК EBER FE R 
А В 2360186 Д ВЕ] 2], ЖЕЛЕ Е EE 
П, ЖЕ): Н ӘЛИ ЗЭ Н, WRA thresh 04 
JO, Mii ВУЧО u, 85 Pj 48 ЛЖ) 
闭合 的 轮 廊 线 ， 因 为 这 样 的 运算 会 包括 输入 图 
像 中 所 有 的 过 零点 ; 

sigma {А Е А Беу ЮЕ ТА А ВИЕ. А 
ЛЕТ, ИТЕ ЇН 22, Wa K xn, n 的 计算 
方法 为 n =ceil (sigma х3) х2+1. 


返回 值 : 


BW 为 返回 的 二 值 图 像 ， 其 中 0 (HE) JA 
景 ，1 (白色 ) 为 边缘 部 分 。 


3. Ж J Canny F H Zç II 


BW = edge(I,'canny',thresh,sigma) 


参数 说 明 : 


° І = Ср НУ; 

B2 TSAN“ cany KaK H cany T; 
thresh ERORE 18 2:255, RME TIERE 
D Si mR E, Саппу ЕЕ НЕЛЕ N 
А д АА, AA NRA H AE E 
上 下 限 ; ÆI XE BREER, 2617476828 ЇН 
FER, #24 2628 Z2JBR8 ЕИ; 如 末 只 指定 一 个 
БИН ло, ДА ЕНЕ ИВ БЕУ ИЕ 
ER, ШЕ УО.А ЛЯ ЖЕЕ Н FPR; ШЖ 
БН РЕН 1н E. MIEZ H ITH ЛЕД ЛЕЛЕ |] 
EE. FIR; 

sigma Tñ х2 А pk PIE E H BJ Fa ТЕ 6 WJ En E 
Æo MUR, MEZENI, ЁЛ УП xn, n 
的 计算 方法 为 n =ceil (sigma x3) x2+1。 


人 返回 值 : 


BW 为 返回 的 二 值 图 像 ， 其 中 0 С) WE 
景 ，1 (白色 ) 为 边缘 部 分 。 


[112.11] Xh IB И ERP 
2А PETA SET PPE, EH А НУТ Ж ИШ 
出 结 来 显示 在 同一 窗口 中 以 便 进 行 比较 。 


相应 的 MATLAB 实 现代 码 如 下 。 


intensity = imread('circuit.tif'); Л ERZ 


edge(intensity, 'sobel'); 
edge(intensity, 'prewitt'); 
edge(intensity, 'roberts'); 
edge(intensity, 'log'); 
edge(intensity, 'canny'); 


subplot(3,2,1); imshow(intensity); title('a'); % [12.6 

(a) 

subplot(3,2,2); imshow(bw1); title('b' 

subplot(3,2,3); imshow(bw2); title('c' 

subplot(3,2,4); imshow(bw3); title('d' 
e 
f 


图 12 .6(b) 
412.6(с) 
图 12.6(d) 
图 12.6(e) 
图 12.6(f) 


subplot(3,2,5); imshow(bw4); title('e' 
subplot(3,2,6); imshow(bw5); title('f'); 


SS N XN XN X 





БИЛ Уа Я 12.6077. 


从 图 12.6 中 可 以 看 出 ， 不 同 算 法 得 到 的 结 琳 仔 
在 很 大 达 寞 ， 下 和 面 进行 傈 要 的 分 析 。 





(c) Prewitt 边 缘 检 测 


т 
I 
) 
Ц А, 
I 
. 上 
ll, | 1 
©. ЭЪ | 
一 | 
一 | 
ILJ 





г = = ww —— == - : , 
роз J ЕЕЕ) | | 
=a Г = = — 一 一 = | | í 
Km ГЭ | | S с Еренек: \| l а; 
r ` <) rg -省 иеш | ат \ | 

| ШИ! | | | | | 

| | | | | ~ x 

ШЕЕ: | (| (|1 | 

е, 2) a (= = | | | Кы: pas x ) | 
=! >= == (Жу | | 

(е) LoG 边 缘 检 测 (f) Canny 边 缘 检 测 


图 12.6” 几 种 算法 的 结 来 比较 


(1) 从 过 绿 定位 的 精度 看 。Roberts 算 于 和 Log 
PL AE FB ДЕ Ж Fu o 


Roberts. J WEAN, Гов f ЈАН HT 
MENNEM. MHLog AT Н НЕК 12) Ж 
位 置信 息 ， 不 能 得 到 边 绿 的 方 问 等 信息 。 


(2) 从 对 不 同方 回 边 缘 的 啊 应 看 。 从 对 边缘 
方 同 的 敏感 性 而 言 ，Sobel 算 子 、Prewitt 算 子 检测 斜 
品 阶 跃 边缘 效果 较 好 ，Roberts 算 子 检测 水 平和 王 直 


JZ AM KARA, Гор ГИ ЛУ FL 2612 ZJ [н] 8 ВЕ 


О 


< 


Sobel A T PJ К ЕН lJ Ж 7] [в] Їн ИГ - 


(3) 从 去 噪 能 力 看 。Roberts 和 Log 算 子 定位 精 
ВВ, (H Ze ЕЩ K o 


Sobel 算 子 和 Prewitt 算 于 模板 相对 较 关 因而 去 唉 
能 力 较 强 ， 有 共有 平 请 作用 ， 能 涯 除 一 些 噪声 ， 去 把 
部 分 伪 边 缘 ， 但 同时 也 平滑 了 真正 的 边缘 ， 这 也 正 
征 其 定位 精度 不 高 的 原因 。 


从 总 体 效 果 来 衡量 ，Canny 算 子 给 出 了 一 种 边 
绿 定 位 狂 确 性 和 抗 噪声 干扰 性 的 较 好 折 中 。 
注意 

以 上 验证 结果 及 分 析 是 基于 阶 跃 变 化 假设 进行 的 。 但 真实 的 灰 度 
变化 不 一 定 都 是 阶 跃 的 ， 有 可 能 发 生 在 很 宽 的 灰 度 范围 上 ， 且 存在 灰 


度 的 起 沙 。 因 此 ， 操 作者 应 当 根 据 工 程 实际 对 各 种 算 子 做 比较 后 加 以 
选用 。 


12.2.4 Visual C++ 实现 
1. 基于 梯度 算 子 的 边缘 检测 
在 5.2.5 小 节 曾 介绍 过 用 于 线性 滤波 的 通用 模板 


HEIE KA Template(), ЯРДАМ Н) st hu 7J Z 2 Jl 
Н 1р6 uJ ЗЕТ ЛЕ А J J Ж} WI, 
下 面 以 Sobel 边 经 检测 为 例 进 行 说 明 ， 使 用 Prewitt 和 和 
Robert 算 子 的 边缘 检测 实现 方法 与 乙 闫 似 。 


在 5.5.2 小 节 兽 介绍 过 能 够 计算 Sobel 樟 虚 的 
ЕШегЅоБе1() 2 2, П Sobel 250-1112 
ЕавеЅоБе) Ж f TF Pr) УК, АУЕ BURET 
国 什 化 处 理 ;， 此 外 ，EdgeSobel0 还 可 以 像 MATLAB 
图 数 edge0 一 样 得 到 细 化 的 按 绿 以 及 检测 不 同方 同 
的 边缘 ， 包 括 水 平 、 竖 直 、45" 和 135" 方 向 ， 默 认 
情况 下 EdgeSobel0 计 算 所 有 方 同 的 边缘 。 


下 面 给 出 EdgeSobel0 算 法 的 完整 实现 。 


人 


BOOL CImgProcess::EdgeSobel(CImgProcess * pTo, BYTE bTh 
re, BYTE bEdgeType, BOOL bThinning, BOOL bGOnly) 
功能 : ”基于 Sobel 算 子 的 边缘 检测 
参数 : ”CImgProcess * pTo: 指向 输出 图 像 的 指针 
BYTE bThre: 人 为 指定 的 边缘 国 仁 。 默 认为 6， 即 目 动 确定 国人 
BYTE bEdgeType: _EdgeAll- 所 有 边缘 _EdgeH- 水 平 边 绿 _Ed 
geV- 垂 直 边 缘 “EdgeCN-45 度 边 缘 _EdgeCCNW-135 度 边缘 其 他 - 


无 效 
BOOL bThinning: 诀 定 是 售 进 行 边 缘 细 化 ， 默 认为 true， 即 执 
行 边缘 细 化 


BOOL bGOnly: Ж ИХ НАЕЛ ЧИ, КА у Ға1ѕе, 8] 
Ж ЙН Ла HJ ë 9 

HEKSA truek, bThre#2X#lbThinning2Z 214 Z l 
返回 值 : 


布尔 类 型 ，true 为 成 功 ，false 为 失败 
TD Tm ЕЕ БЕКЕ TT RT TT TT TT TT 
BOOL CImgProcess::EdgeSobel(CImgProcess * pTo, BYTE bTh 
re, BYTE bEdgeType, BOOL bThinning, BOOL bGOnly) 


l 
if (m pBMIH->biBitCount!=8) return false; 


// 定义 模板 数据 

// 水 平 边缘 

const float cfSobelH[9] = í 
-1, -1, -1, 
0, Ө, ©, 
1, ly 1}; 

// EHZ 

const float cfSobelV|[9]|] 
= Lo ð, 1, 
aty е, 1; 
=L ð, 1 }; 

// 45 度 边缘 

const float cfSobelCW[9] = í 
-1, -1, 0, 
-1, 0, 1, 
0, 1, 1}; 

// 135 度 边缘 

const float cfSobelCCW[9] = { 
0, 1, 1, 
= ð, 1; 
= = L 0 j; 


II 
m 


// | СЇтрРгосе<$5 н 
CImgProcess imgTemp = *this; 
CImgProcess imgMid = *this; 


// 根据 选择 的 边缘 类 型 应 用 模板 
switch (bEdgeType) í 


case 6: // WEZ% 


Template(&imgTemp, 3, 3, 1, 1, (float*)cfSobelH, 


(float*)cfSobelH, 


(float*)cfSobelV, 


(float*)cfSobelCW 


(float*)cfSobelCC 


1); 
Template(&imgMid, 3, 3, 1, 1, (float*)cfSobelV, 
1); 
imgTemp = imgTemp + imgMid; 
Template(&imgMid, 3, 3, 1, 1, (float*)cfSobelCW, 
1); 
imgTemp = imgTemp + imgMid; 
Template(&imgMid, 3, 3, 1, 1, (float*)cfSobelCCW 
› 1); 
imgTemp = imgTemp + imgMid; 
break; 
case 1: // 水 平 边 绿 
Template(&imgTemp, 3, 3, 1, 1, 
1); 
һгеаК; 
case 2: // 垂直 边缘 
Template(&imgTemp, 3, 3, 1, 1, 
1); 
һгеаК; 
case 3: // 45122 
Template(&imgTemp, 3, 3, 1, 1, 
› 1); 
break; 
case 4: // 135217 
Template(&imgTemp, 3, 3, 1, 1, 
W, 1); 


break; 


default: // 参数 错误 


return false; 


}» 
if (bGOnly) 


l 
// qubba g 
*pTo = imgTemp; 


J 

else 

{ 
// 根据 指定 国信 进行 国 全 化 
if (bThre) 
{ 


imgTemp.Threshold(pTo, bThre); 
} 
else // 目 动 网 值 化 


l 
imgTemp.AutoThreshold(pTo); 
}; 


if (bThinning) 

l 
// 第 一 次 反 色 : 为 边缘 细 化 准备 
pTo->LinTran(&imgTemp, -1, 255); 


// 边缘 细 化 
imgTemp .Thining() ; 


// 第 二 次 反 色 : 得 到 最 终结 果 
imgTemp.LinTran(pTo, -1, 255); 
} 
} 


return true; 


| 


注意 到 算法 中 当 bTPhre 参数 为 false 时 ， 调 用 了 
AutoThresholdO 4 5221 ГЛ АУ А 570 ИН 
化 ， 本 章 将 在 12.4.3 小 节 对 它 进行 详细 阐述 。 


算法 的 最 后 还 提供 了 可 选 的 边缘 细 化 操作 ， 有 是 
通过 11.3.5 小 节 介 绍 过 的 形态 学 细 化 方法 Thining() 
实现 的 。 


利用 EdgeSobel0 函 数 实 现 边 缘 检 测 的 完整 示例 
伏 封 痛 在 DIPDemo 工 程 中 的 视 网 关 函数 void 
CDIPDemoView::OnEdgeSobel0 中 ， 其 中 调用 
EdgeSobel() A НИЧ r Br ill F PZ 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// Sobel 边 缘 检 测 
imgInput.EdgeSobel(&imgOutput, dlg.m bThre, dlg.m nEd 
geType, dlg.m bThining, dlg.m 


bGratOnly); 
// 其 中 dlg.m_nEdgeType 古 用 户 在 对 话 框 中 选择 的 希望 检测 的 边 
经 方 同 种 类 


pDoc->m Image = imgOutput; 





上 述 程序 运行 时 会 弹出 对 话 伍 要 求人 设置 边 绿 从 


训 参 数 。 旋 者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 
的 订单 命令 “图 像 分 割 一 边 绿 检测 Sobel AT” RA 
эх АР. 


Robert 和 Prewitt 辽 绿 检 测算 法 航 封 痛 在 
CImgProcess 茯 的 EdgeRoberts0 和 EdgePrewittO 方 法 
中 ， 其 实现 思路 与 EdgeSobel0 算 法 类 似 ， 这 里 不 再 
BOR 
PLIKA o 


2. T a -A E НАЈ ЖУ WI 


HET LOGA T НЛ AIM A Н ЕЛЕ s gl АП 
F о 


FT ЕЕЕ ЕЕЕ ЕЕЕ ИРИ АВР ЕЕ ЕЕ ЕЕЕ БЕЕК ЕЕЕ 
void CImgProcess::EdgeLoG(CImgProcess * pTo, BYTE bThre 
› double dSigma, BOOL bThinning) 

功能 : 基于 LoG 算 子 的 边缘 检测 

参数 : CImgProcess * pTo: 指向 输出 图 像 的 指针 

返回 值 ， 无 
下 
void CImgProcess: :EdgeLoG(CImgProcess * pTo) 


{ 
// 应 用 模板 到 图 像 
Template(pTo, 5, 5, 2, 2, Template Log, 1); 


// | СЇтрРгосе$5 н 
CImgProcess imgTemp = *pTo; 


// 目 动 国人 化 
imgTemp .AutoThreshold(pTo); 


// 第 一 次 反 色 : 为 边缘 细 化 准备 
pTo->LinTran(&imgTemp, -1, 255); 


// 边缘 细 化 
imgTemp .Thining() ; 


// 第 二 次 反 色 : 得 到 最 终结 
imgTemp.LinTran(pTo, -1, 255); 





利用 EdgeLogO 函 数 实 现 边 缘 检 测 的 完整 示例 
5ТЕ рТРрето LFE. НУХА 2 06 5 уоіа 
CDIPDemoView::OnEdgeLogO0 中 ， 其 中 调用 
EdgeLog(PR 28 HJ 5 т Br HH F ТУХ o 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


imgInput.EdgeLoG(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命令 “图 像 分 割 边缘 检测 -LoG 算 子 ” 来 观察 处 
理 效 果 。 


3， 基 于 Canny 算 子 的 边 绿 从 名 


Canny 算 法 需要 进行 多 步 操 作 ， 在 进行 国信 化 
时 还 需要 近 供 上 、 IRB BE < Ат I н 
边缘 连接 操作 。 相 关 的 代 但 如 下 。 


о ааа 


BOOL CImgProcess::EdgeCanny(CImgProcess * pTo, BYTE bTh 
геі, ВҮТЕ bThreH, BOOL bThinning) 
功能 : ”基于 Canny 算 子 的 边缘 检测 
参数 : СІтеРгосеѕ5 * pTo: 指向 输出 图 像 的 指针 
BYTE bThreL, BYTE bThreH: 认定 边缘 的 低 浆 值 和 高 阔 值 
将 任 一 设置 为 8 则 会 伏 目 动 生 成 ， 生 成 高 国 值 时 会 自动 敌 辣 低 
{Н 
UEIN, BIA 5AE КИК ЇН 
BOOL bThinning: 52 9 1701471024810, A ANtrue, ИТ 
边缘 细 化 
返回 值 : ”布尔 类 型 ，true 为 成 功 ，false 为 失败 
а о о оа ааа 
BOOL CImgProcess::EdgeCanny(CImgProcess * pTo, BYTE bTh 
геі, ВҮТЕ bThreH, BOOL bThinning) 
{ 
inti,J; 
if (m pBMIH->biBitCount!=8) return false; 


// AN RE 

CImgProcess imgGH = *this, imgGV = *this, ImgGCW 
= *this, imgGCCW = *this, 

imgGratitude = *this; 


// 使 用 Prewitt 模 板 计 算 各 个 方 回 上 的 梯度 值 
EdgePrewitt(&imgGH, ©, 1, ©, 1); 
EdgePrewitt(&imgGV, ©, 2, ©, 1); 
EdgePrewitt(&imgGCW, Ө, 3, Ө, 1); 
EdgePrewitt(&imgGCCW, ©, 4, Ө, 1); 


// 最 大 梯度 方 回 
BYTE * pbDirection = new BYTE [GetHeight() * GetWid 
thByte()]; 


memset(pbDirection, ©, GetHeight() * GetWidthByte() 
* sizeof(BYTE)); 


// ЗЕ кА KAJ HS ЛОЛУ НУ ре KARS E 
imgGratitude.InitPixels(0); 
for (i=0; i<GetHeight(); i++) 


l 


ay)); 


ay)); 


for (3=0; j<GetWidthPixel(); j++) 


BYTE gray = 0; 


if (imgGH.GetGray(j, i) > gray) 

l 
gray = imgGH.GetGray(j, i); 
pbDirection[i * GetWidthPixel() + j] = _EdgeH; 
imgGratitude.SetPixel(j, i, RGB(gray, gray, gr 


} 


if (imgGV.GetGray(j, i) > gray) 

{ 
gray = imgGV.GetGray(j, i); 
pbDirection[i * GetWidthPixel() + j] = _EdgeV; 
imgGratitude.SetPixel(j, i, RGB(gray, gray, gr 


) 


if (imgGCW.GetGray(j, i) > gray) 
{ 
gray = imgGCW.GetGray(j, i); 
pbDirection[i * GetWidthPixel() + j] = _EdgeCW 


imgGratitude.SetPixel(j, i, RGB(gray, gray, gr 


ay)); 
J 
if (imgGCCW.GetGray(j, i) > gray) 
{ 
gray = imgGCCW.GetGray(j, i); 
pbDirection[i * GetWidthPixel() + j] = _EdgeCC 
W; 
imgGratitude.SetPixel(j, i, RGB(gray, gray, gr 
ay)); 
J 
J 


// REKAN EHA HENI 
CImgProcess *pImgThreL = &imgGH, *pImgThreH = &imgG 


// WEBRESZOG WRZ E ВИА ДТ RRITE E 
if (bThreL > bThreH) return false; 


if (bThreH == 0) { 
const int nMinDiff = 20; 
int nDiffGray; 


bThreH = 1.2 * imgGratitude.DetectThreshold(CRect( 
ð, 0, GetWidthPixel(), 

GetHeight()), nDiffGray); 

bThreL = 0.4 * bThreH; 


if(nDiffGray < nMinDiff) return false; 
J 


if (bThreL == 0) { 
pThreL = 0.4 * bThreH; 


) 


// KERE E И a КЇЙ. 2727847 {Н И. 
imgGratitude.Threshold(pImgThreL, bThreL); 
imgGratitude.Threshold(pImgThreH, bThreH); 


// 初始 化 目标 图 像 
pTo->InitPixels(0); 


// 根据 低 准 但 图 像 在 高 国信 图 像 上 进行 边 界 修补 
for (1=1; i<GetHeight()-1; i++) 


{ 
for (j=1; j<GetWidthPixel()-1; j++) 
{ 
if (pImgThreH->GetGray(j, 1)) 
{ 
// ARE RERI ЕЕ 
pTo->SetPixel(j, i, КСВ(255, 255, 255)); 
// ЗЛЕ в КО ы ЕҤ) 
switch ( pbDirection[i * GetWidthPixel() + j] 
) Í 
case 1: // 水 平方 癌 
if (pImgThreL->GetGray(j+1, i)) 
{ 
pImgThreH->SetPixel(j+1, i, RGB(255, 255 
， 255)); 
if (pImgThreL->GetGray(j-1, i)) 
l 
pImgThreH->SetPixel(j-1, i, RGB(255, 255 
， 255)); 
} 
һгеаК; 


case 2: // 垂直 方向 


y 255)); 


› 255)); 


55, 


55, 


55, 


55, 


255)); 


255)); 


255)); 


255)); 


if (plmgThreL->GetGray(j, 1+1)) 


pImgThreH->SetPixel(j, 1+1, RGB(255, 255 


J 
if (pImgThreL->GetGray(j, 1-1)) 


pImgThreH->SetPixel(j, i-1, RGB(255, 255 


) 


break; 


case 3: // 45/7 [6] 
if (plmgThreL->GetGray(j+1, 1-1)) 


pImgThreH->SetPixel(j+1, i-1, RGB(255, 2 


J 
if (plmgThreL->GetGray(j-1, 1+1)) 


pImgThreH->SetPixel(j-1, 1+1, RGB(255, 2 


) 


break; 


case 4: // 135JE In] 
if (plmgThreL->GetGray(j+1, 1+1)) 


pImgThreH->SetPixel(j+1, i+1, RGB(255, 2 


if (plmgThreL->GetGray(j-1, 1-1)) 


l 
pImgThreH->SetPixel(j-1, i-1, RGB(255, 2 


ргеак; 


J 
}//if 
}//for j 
yfor i 


if (bThinning) 

l 
// 第 一 次 反 色 : 为 边缘 细 化 准备 
pImgThreH->LinTran(pImgThreL, -1, 255); 


// 边缘 细 化 
pImgThreL->Thining(); 


// 第 二 次 反 色 : 得 到 最 终结 
pImgThreL->LinTran(pTo, -1, 255); 
J 


else 


l 
*pTo = *рІтетһген; 


delete pbDirection; 


return true; 


А) НЕавеСаппу() K RK ELZ ЖУЙ АЧ Së ЛК 
| 42 Же ZEDIPDemo TFE F АЧА 2 pR 数 void 
CDIPDemoView::OnEdgeCanny0O0 中 ， 其 中 调用 
EdgeCanny( рК 81014 А Br ill F PTZ 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


imgInput.EdgeCanny(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





上 述 程 序 运行 时 会 弹出 对 话 杠 要求 设置 边 绿 检 
测 参 数 。 谈 者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 
的 京 单 命令 “图 像 分 割 =” 边 绿 检 测 Cany A T” A 
观察 处 理 效 果 。 


123 ERTH 


1227172 Y EAMA 9027175. TH sk 
际 中 由 于 噪声 和 区 照 不 均等 因 系 ， 使 得 在 很 多 情况 
下 所 获得 的 边缘 点 是 不 连续 的 ， 必 须 通 过 边缘 连接 
将 它们 转换 为 有 意义 的 边缘 。 一 般 的 做 法 是 对 经 过 
边 经 从 汕 的 图 像 进 一 步 使 用 连接 技术 ， 从 而 将 边 绿 
КЕН ЛК ЛЕЛЕ ТИЛ Ж. 


ER (Hough) 变换 是 一 个 非 党 重要 的 检 训 间 
尘 点 边界 形状 的 方法 。 它 通过 将 图 像 坐标 空间 变换 
PSAT, KEME RA HRMS 


12.31 直线 检测 
1. 直角 坐标 参数 空间 


在 图 像 x -y 坐标 空间 中 ， 经 过 点 (х,у) WA 
线 表 示 为 : 


1; = ar; + b 
(12-15) 
其 中 ， 参 数 a IRE, b IEE 
通过 点 (xi ,yi ) 的 且 线 有 无 数 条 ， 且 对 应 于 
不 同 的 a Mb 48, ТЇЙ ХЕ sk (12-15) 。 
Ж x 和 yi 贫 为 遇 数 ， 而 将 原本 的 参数 a Jb 
看 作 变 量 ， 将 式 (12-15) 表示 为 : 


b = 一 Ti 十 其 
(12-16) 
就 变换 到 了 参数 平面 a -b 。 这 个 变换 就 是 直角 
坐标 中 对 于 Сх, уг) 点 的 Hough 变 换 。 访 直线 是 多 


像 坐 标 空间 中 的 点 Оп, yi) 在 参数 空间 的 唯一 方 
程 。 考 虑 图 像 坐标 空间 中 的 另 一 点 (wy ур). È 


在 参数 空间 中 也 有 相应 的 一 条 生 线 ， 表 示 为 : 


b = —T;a + W; 
(12-17) 


这 条 直线 与 点 (х,у) 在 参数 空间 的 直线 相 
交 于 一 点 Cago, bo) ， 如 网 12.7 所 示 。 


图 保 坐 标 空间 中 过 后 (ху, у; MA (x; ру) 
的 直线 上 的 每 一 点 在 参数 空间 qa b 上 各 自 对 应 一 
直线 ， 这 些 直 线 都 相交 于 点 (qag,bo ) > Magos 
束 古 图 像 坐 标 空间 x -y PA Сх, уг) MISA (ху, у; 
) 所 确定 的 直线 的 参数 。 反 之， 在 参数 空 : 间 相交 于 
间 一 点 的 所 有 再 线 ， аре x 则 都 有 共 线 的 点 
与 之 对 应 。 根 据 这 个 特性 ， 给 定 图 像 坐 标 空 间 的 一 
些 边 绿 点 ， 束 可 以 通过 Hough 变 换 人 确定 连接 这 些 点 
的 直线 方程 。 





(a) 图 像 坐标 空间 (b) 参数 空间 
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具体 计算 时 ， 可 将 参数 空间 视 为 离散 的 。 建 并 
一 个 二 维 累 加 数组 A (a,b) ， 第 一 维 的 范围 是 图 
像 坐 标 空间 中 直线 斜率 的 可 能 苑 围 ， 第 二 维 的 苑 赎 
是 图 像 坐 标 空 间 中 直线 截 距 的 可 能 范围 。 开 始 时 A 
(а,Ь) 初始 化 为 0， 然 后 对 图 像 坐标 空间 的 每 一 
个 前 景点 《xi yi) ， 将 参数 军 间 中 每 一 个 a 的 离散 
EIRA (12-16) ， 从 而 计算 出 对 应 的 b 值 。 每 计 
算出 一 对 (a ,b ) ， 都 将 对 应 的 数组 元 素 A (а, Б 
) 加 1， 即 4(a.5)=4(a9)+1。 所 有 的 计算 都 结束 后 ， 在 
参数 容 间 表决 结果 中 找到 A (а,Ь) 的 最 大 峰值 ， 
所 对 应 的 ao bo 束 是 原 图 像 中 共 线 点 数目 最 多 
(ЖА Cao bo) 个 共 线 点 ) 的 直线 方程 的 参数 ; 
接 下 来 可 以 继续 寻找 次 峰 信 和 第 3 峰 住 第 4 峰 信 等， 
它们 对 应 于 原 图 中 共 线 点 数 上 日 略 少 一 些 的 下 线 。 





y —. 


由 于 原 图 中 的 直线 往往 具有 一 定 的 宽度 ， 实 际 上 相当 于 多 条 
参数 极其 接近 的 蛙 像 系 冤 卫 线 ， 往 往 对 应 于 参数 空间 中 相 邻 的 多 个 于 
加 右 蛙 元 。 因 此 每 找到 一 个 当前 最 大 的 峰值 点 后 ， 需 要 将 该 点 及 其 附 
近 点 清 零 ， 以 防 算法 检测 出 多 条 极其 邻近 的 “ 假 ? 百 线 。 


对 于 图 12.7 (а) 的 Hough 变 换 参 数 空 间 情况 如 
图 12.8 所 示 。 


b 


Е 
sss 
da ү үү ы 


| | м ы l j 
Ы 
0 


4128 ”参数 空间 表决 结果 


这 种 利用 二 维 索 加 胡 的 离 克 化 方法 大 大 位 化 了 
Hough HAIR, 参数 空间 a -b 上 的 细 分 程度 决 
E S RARI ERER. ERIZE R 
加 数组 A ZH+B 26 РК уНоцоп [+ . 





y —. 


ЗЕЕ EL ЕЕ Ура 2& 3 El EL Zk nk ВОЛ aE El. EL 


АЕ, ЕАН J GR Kaka Бе 28, JA 20 29 2 [ila 
-b 中 表示 出 来 。 为 了 解决 这 一 问题 ， 可 以 及 用 极 坐标 系 。 


2. 极 坐 标 参 数 空间 
极 坐 标 中 用 如 下 参数 方程 表示 一 条 生 线 。 


p = T cos f + ysing 
(12-18) 


其 中 ，p 代表 直线 到 原点 的 垂直 距离 ，0 代表 x 
轴 到 直线 垂 线 的 角度 ， 取 值 范 围 为 +490"， 如 图 12.9 
所 示 。 


与 直角 坐标 类 似 ， 极 坐标 中 的 Hough 变 换 也 将 
图 像 坐 标 空间 中 的 后 变换 到 参数 空间 中 。 在 极 坐 标 
表示 下 ， 图 像 坐标 空间 中 共 线 的 扣 变 换 到 参数 空间 
中 后 ， 在 参数 空间 都 相交 于 同一 氮 ， 此 时 所 得 到 的 
p、9 即 为 所 求 的 卫 线 的 极 坐标 参数 。 与 直角 坐标 
不 同 的 是 ， 用 极 坐 标 表 示 时 ， 图 像 坐标 空间 的 共 线 
的 两 点 Сх, уг) 和 (xj ,yj ) 映 喘 到 参数 空间 是 两 
条 正弦 曲线 ， 相 交 于 点 (po 00) ， 如 图 12.10 所 
У о 


4129 ҤЖ% дл 


(х, у) 


0 
р=х;с050 + у,51160 


(po, 0) 


р=х;с050+ ysin 


p 





图 12.10 ТШ F JL Ae pR 12:97 [8] 


具体 计算 时 ， 与 十 角 坐标 类似 ， 也 要 在 参数 空 
їн) Н ЖЁ эЛ — 4 ERUH RIAA, R BUE ya EA 
同 。 对 一 幅 大 小 为 D xD WEZ, ЖШ йур НЈЊИН u В 
为 Fv2D2.v2D 站 ，9 的 取 值 范围 为 [-90*，90°]。 计 算 
方法 与 且 角 坐标 系 中 崇 加 如 的 计算 方法 相同 ， 最 后 
得 到 最 大 的 A 所 对 应 的 (p , Ө )。 


12.3.2 ”曲线 检测 


Ноцпаһ®{® [5] H J ЖЕ СНА HHI Zk SFM], 
图 像 坐 标 空间 中 的 一 条 已 知 的 曲线 方程 也 可 以 建 并 
其 相应 的 参数 空间 。 由 此 ， 图 像 坐标 空间 中 的 一 
к, EART [Н] НН] РАШУУ] ЖУЛЫН ДУ НЛ НН 2% БК 
者 曲面 。 奉 参数 空间 中 对 应 各 个 间断 点 的 曲线 或 者 
由 面 能 够 相交 ， 束 能 够 找到 参数 空间 的 极 大 值 以 友 
对 应 的 参数 ; 看 参数 空间 中 对 应 各 个 间断 氮 的 曲线 
“ашы ИВ [НТ 4 Fr ои С, АПШ 


Ноцећ Hefi УИ, жнр Н Eš] 
像 坐 标 空间 到 参数 空间 的 变换 公 陈 。 例 如 ， 对 于 己 
ХАНА, ЖААН) Е: 

(z а) + (g —b)° = r? 


(12-19) 


其 中 ， (а, b) 为 圆心 坐标 ，7 为 圆 的 半径 ， 
它们 为 图 像 的 参数 。 


那么 ， 参 数 空间 可 以 表示 为 (qa, b, г), 8 
傈 坐标 空间 中 的 一 个 圆 对 应 参数 空间 中 的 一 点 。 


有 具体 计算 时 ， 与 前 面 讨 论 的 方法 相同 ， 只 和 古 数 
组 累加 器 为 三 维 A (а, b, r) 。 计 算 过 程 是 让 
а, ЬЕ ЯХИН ўс Е Ру И, ЕН е EAr 值 ， 


ІРА 4 (а, b, r) B, Ж 0А (a 
„Б, r) 加 一 。 计 算 结束 后 ， 找 到 的 了 最 大 的 A (a 
, b, r) 所 对 应 的 qa 、b 、r 束 是 所 求 的 圆 的 参 
Ж 。 

与 年 线 检测 一 样 ， 曲 线 检测 也 可 以 通过 极 坐 标 
МНЯ. 


注意 

通过 Hough 变 换 做 曲线 检测 时 ， 参 数 空间 的 大 小 将 随 着 参数 个 数 
的 增加 呈 指 数 上 升 的 趋势 ， 故 在 实际 使 用 时 要 尽量 减少 描述 曲线 的 参 
数 数目 。 因 此 ， 这 种 曲线 检测 的 方法 只 对 检测 参数 较 少 的 曲线 有 意 
义 。 


12.3.3 ”任意 形状 的 检测 


这 里 所 说 的 任意 形状 的 检测 ， 是 指 应 用 三 义 
Hough 变 换 去 检测 某 一 任意 形状 边界 的 图 形 。 它 首 
先 选 取 该 形状 中 的 任意 点 (a ，b ) 为 参考 点 ， 然 后 从 
该 任意 形状 图 形 的 边 绿 每 一 点 上 ， 计 算 其 切线 方 同 
o 和 到 参考 点 (qa ，b ) 位 置 的 偏 移 和 失 量 r ， 以 及 r 与 x 
轴 的 夹 角 a ， 如 图 12.11 所 示 。 






(х, у) 


412.11 J ХНоцеһ 
参考 点 (а, b) 的 位 置 可 由 下 式 算 出 : 


q = т 4 г(ф)сов((@!}) 


(12-20) 


b= х + r(ào)sin(a [o )) 


(12-21) 


利用 广义 Hough 变 换 检 测 任意 形状 边界 的 主要 
步骤 如 下 。 


(1) 在 预知 区 域 形 状 的 条 件 下 ， 将 物体 边 绿 
形状 编 成 参考 表 。 对 于 每 个 边 绿 点 计算 楷 上 度 角 gi ， 
对 每 一 个 梯度 角 wg; ， 算 出 对 应 于 参考 点 的 距离 r; 和 
Ло; 。 例 如 ， 图 12.11 中 ， 同 一 个 梯度 角 q 对 应 两 
个 上 把， 则 参考 表 表 示 为 : 


(p : CEE 24 ) (гә, MD ) 


HE, a ARZ АИВ e fo; 所 对 应 的 参考 
Ko 


(2) 在 参数 空间 建立 一 个 二 维 累 加 数组 A (a 
, b) ， 初 值 为 0。 对 边 绿 上 的 每 一 点 ， 计 算出 该 点 
处 的 梯度 角 ， 然 后 ， 由 上 式 计算 出 每 一 个 可 能 的 参 
考点 的 位 置 值 ， 对 相应 的 数组 元 系 A (a, b) 加 


(3) 计算 结束 后 ， 具 有 最 大 值 的 数组 元 系 A 
(a, b) 所 对 应 的 a b 值 即 为 图 像 坐标 空间 中 所 
求 的 参考 点 。 


KH к/а, ЖАНА ЯА Н] РАШ ЛЕ 
7. 


12.3.4 Hough 变 换 直 线 检 测 的 MATLAB 
实现 


通过 Hough 变 换 在 二 信和 图 像 中 检 训 百 线 需要 以 


下 3 个 步骤 。 


(1) 利用 houghO 函 数 执行 霍 夫 变换 ， 得 到 霍 
KERE. 


(2) #1 HhoughpeaksO KRE E RIE BE rH IE 
峰值 点 。 


(3) ПЕС 吉 末 的 基 
础 上 得 到 原本 值 图像 中 的 二线 信息 


1. = Kal 


Hough( р —[ {Н @1А1тТНоцирһ%{й, 
得 到 Hough 和 矩阵 。 调 用 形式 如 下 。 


[H, theta, rho] = hough(BW,param1,val1,param2,val2) 


参数 说 明 : 





hough 


° BW 征 边 绿 检测 后 的 二 值 图 像 : 
° 日 人选 参数 对 儿 param 1. value 1 以 及 param 
2. value 2 的 合法 取信 如 表 12.3 上 所 示 。 


212.3 param 参数 的 合法 取 全 及 其 意义 
param 取 值 


”|Hough 箱 阵 中 轴 方 向 上 单位 区 间 的 长 度 〔 以 “ 度 * 为 单位 ) ， 可 取 (0， 
ThetaResolution |90) 区 间 上 的 实数 ， 默 认为 1 








Hough#E "р 轴 方 向 上 单位 区 间 的 长 度 ， 可 取 (0，norm(size(BW))) 区 间 
上 的 实数 ， 默 认为 1 


返回 值 : 


° 万 是 变换 得 到 的 Hough ERE; 
e theta 和 rho 为 分 别 对 应 于 Hough 窍 阵 每 一 列 和 每 
一 行 的 9 Mp 值 组 成 的 问 量 。 
2. FRIRE 


Houghpeaks() р ZZ Hj T-YfEHoughiB pE rH fkt 
定数 目的 峰值 点 ， 调 用 形式 如 下 。 


peaks = houghpeaks(H,numpeaks, param1,val1,param2,val2) 





houghpeaks 


参数 说 明 : 


° 万 是 НһоивһО F РЁ ЖҮЛ ЖП Ноне ҺЕ E; 

° numpeaks 是 要 村 找 的 峰值 数目 ， 默 认为 1 

° 蝇 选 参数 对 儿 Pparam 1. value 1 以 及 param 
2. value 2 的 合法 取 值 如 表 12.4 所 示 。 


112.4 ”param 参 数 的 合法 取 值 及 其 总 


=L oe 


峰值 的 国 值 ， 只 有 大 于 该 国 值 的 点 才 被 认为 是 可 能 的 峰值 ， 其 取 值 >0， 默 认 
为 0.5xmax(H(:)) 





次 检测 出 一 个 峰值 后 ，NhoodSize 指 出 了 在 该 峰值 周围 需要 清 零 的 邻 域 信 
do 以 向 量 L[M , N ] 的 形式 给 出 ， 其 中 M 、N 均 为 正 的 奇数 。 默 认为 大 于 等 于 
size (H ) /50 的 最 小 奇数 





° еа р ХОН ВЕ, 51Т РИТ ЛЖ?) Е 
JE МЧА л Е Hough Е 17. 011251, 
为 找到 的 峰值 点 的 数目 。 


3. ERARE 


Houghlines() РЁ 03: Ноцећ RE НАЕ 9:012 
来 提取 下 线段 ， 调 用 语法 如 下 。 





houghlines 


lines = houghlines(BW,theta, rho, peaks, paraml, vall, 


param2, val2) 





参数 说 明 : 


° BW zJ Zç u ҮЛ ja HJ 18.918: 

e theta 和 rho х= НоцоҺ ЕВЕ ЈАВЕ НӨ 和 p 
[ҢҢ БИШ] ж, Hihough()E8 00 |А; 

° peaks 是 一 个 包含 峰值 点 信息 的 Q х2 ЈЕ Е, HH 
houghpeaks()p8 ŽUR [н]; 

。 п] 选 参数 对 儿 Pparam 1. value 1 以 及 param 
2. value 2 的 合法 取信 如 表 12.5 所 示 。 


R125 param 参 数 的 合法 取 值 及 其 意 》 


线段 合并 的 国 值 : 如 果 对 应 于 Hough 窍 阵 东 一 个 单元 格 《〈 相 同 的 6 和 p ) 的 两 个 


检测 的 直线 段 的 最 小 长 度 国 值 : 如 果 检 测 出 的 直线 段 长 度 大 于 MinLengthp ， 则 
保留 ， 丢弃 所 有 长 上 度 小 于 MinLength 的 直线 段 。 默 认 值 为 40 





MinLength 





i 线段 之 间 的 距离 小 于 FillGap ， 则 合并 为 1 个 直线 段 。 默 认 值 为 20 


返回 值 : 


° lines 是 一 个 结构 体 数 组 ， 数 组 长 度 是 找到 的 直 
线条 数 ， 而 每 一 个 数组 元 系 〈 直 线段 结构 体 ) 


的 内 部 结构 如 表 12.6 所 示 。 


表 12.6 lines 的 结构 


ЕВН А1 


HREH 842 








ХУЛИ Е REER HO 








ХУЛИ Е ЖАНЕ р 





[0112.2] 利用 Hough 变 换 对 MATLAB 示 例 图 
Jr circuit. tif HT HAM, 7 Ноор ЕП Ж 
ЭҢ Ҥ, ЖЕЛ Ч АК) 8 EL Zk 


段 。 


相应 的 MATLAB 实 现代 码 如 下 。 





I = imread('circuit.tif'); % 读 取 图 像 


% 旋转 图 像 并 寻找 边缘 
rotI = imrotate(I,33,'crop'); 
BW = edge(rotI,'canny'); 


% 执行 Hough 变 换 并 显示 Hough 和 矩阵 
[H,T,R] = hough(BW); 
imshow(H,[],'XData',T,'YData',R,'InitialMagnification', 


'fit'); % 得 到 图 12.12 (а) 
xlabel('Ntheta'), ylabel('Nrho'); 
axis on, axis normal, hold on; 


% ТЕНооеп [5361515 TrHoughiEErHi KB. 34 ЧЕ 

Р = һоиеһреакѕ (Н, 5, '"Еһгеѕһо1а',се11(0.З*тах(Нн(:)))); 
х = Т(Р(:,2)); у = К(Р(:,1)); % 由 行 、 列 索引 转换 成 实际 坐 
标 

plot(x,y,'s','color','white'); % 在 Hough 和 矩阵 图 像 中 标 出 峰 
值 位 置 


% 找到 并 绘制 直线 

lines = houghlines(BW,T,R,P,'FillGap',5,'MinLength',7); 

% АТАР АЛУ ГЫН) Б, ЖЯ РТЕВЕЛЕЛУ 70 E Zk Z 

figure, imshow(rotI), hold on 

max len = 0; 

for k = 1:length(lines) % 依次 标 出 各 条 直线 段 
xy = [lines(k).pointl; lines(k).point2]; 
plot(xy(:,1),xy(:,2),'LineWidth',2,'Color','green'); 


% ZRI ZR P SA 

plot(xy(1,1),xy(1,2),'x','LineWidth',2,'Color','yell 
ом'); 

р101(ху(2,1),ху(2,2), 'х', 'Ііпеміаёћ', 2, 'Со1ог', 'геа' 


% 确定 最 长 的 线段 
len = norm(lines(k).point1 - lines(k).point2); 
if ( len > max_len) 
max len = len; 
ху Іопе = ху; 
end 
end 


% 局 有 党 显示 最 长 线段 
plot(xy long(:,1),xy long(:,2),'LineWidth',2,'Color','c 


Wl % 得 到 图 12.12 (b) 


上 述 程序 的 运行 绪 末 如 图 12.12 上 所 示 。 





-80 -60 -40 -20 0 20 40 60 80 
0 


(a) Hough Ж РЕВЕ А4 (b) 检测 出 的 直线 段 


412.12 ”Hough 变 换 效 末 (FillGap'=5) 


注意 到 在 houghpeaks0 〇 函数 执行 后 ， 本 控 a 作 共 
得 到 了 5 个 峰值 ， 然 而 图 12.12(b) 的 结果 中 却 出 现 了 
8 条 直线 段 ， 这 正 是 houghlines0) 函 数 中 'FillGap' 参 数 
的 作用 。 将 'FillGap' 设 定 为 80 可 以 合并 原本 共 线 
(有 相同 的 9 和 p ) 的 各 个 百 线 段 ， 将 得 到 如 和 图 
12.135775 AR o 





图 12.13 检测 出 的 直线 段 ('FillGap'=80 ) 


12.3.5 ” Hough 变换 和 直线 检 疯 的 Visual 
C++ 实现 


ВЕ TECImgProcess HJ HoughO р {С uJ LIFR 2] 
图 像 中 前 nLineRet 条 直线 ， 有 具体 步骤 如 下 。 


(1) 彻 始 化 一 个 极 坐标 域 p-0 Z [B] НУ #5 JI 65 Ж 


一 个 前 景点 《算法 中 为 白 点 ) ， 在 极 坐 标 域 的 对 应 
ЖАЛП Же 8.70011. 


(3) 找到 极 坐 标 域 的 当前 最 大 峰值 并 记录 充 
А. 


(4) Же МКИН AARU zu, В НУ Ж ЛП as ҢА. 
ўа = О 


(5) 如 果 已 经 找到 的 峰值 数目 小 于 nLineRet， 
i“ (3) ; 否则 算法 返回 所 有 找到 的 直线 的 参数 信 


¿LUN О 


Ноцећ() р Ж) së 1 F ° 





Ú PPY ee 


BOOL CImgProcess::Hough(SLineInfo *pInfoRet, int nLineR 


功能 : = КАР 
注 : 只 能 处 理 二 信和 图 像 ， 一 般 应 为 经 过 边缘 检测 的 输出 图 像 〈 黑 
ы, НВ) 


参数 : SLineInfo *pInfoRet: 输出 的 直线 信息 

int nLineRet: 需要 寻找 的 直线 数目 
返回 值 : ”BOOL 类 型 ，true 为 成 功 ，false 为 失败 
G k L K i ТЕ ЕЕЕ ЕКЕ u ЕК D S S SK o 
BOOL CImgProcess::Hough(SLineInfo *pInfoRet, int nLineR 
et) 
{ 


int i, J; 


// 极 坐 标 域 中 的 最 大 Rho 和 Theta 

int nMaxDist = sqrt((double)(GetHeight( )*GetHeight( 
) + GetWidthPixel( )*GetWidth 
Pixel())); 

int nMaxAngle = 90; 


// 为 极 坐标 域 分 配 空间 

int nAreaNum = nMaxAngle * nMaxDist * 2; 

int *pTransArea = new int[nAreaNum]; 
memset(pTransArea, 0, nAreaNum * sizeof(int)); 


// 转化 到 极 坐标 域 
BYTE bt ; 
int nAngle, nDist; // 极 坐标 下 的 角度 和 极 径 
double fRadian; // 弧 度 
for(i = 0; i < GetHeight(); i ++) 
{ 
for(j=0; j<GetWidthPixel(); j++) 


bt = GetGray(j, i); 
JTO(DD == 255) 
{ 
Ғог(пАпе1е = Ө; nAngle < nMaxAngle; nAngle ++) 


{ 
ҒАааіап = пАпе1е*2*РІ/180.0; // 转 化 为 弧度 


nDist = (j*cos(fRadian) + i*sin(fRadian)); / 
ПЯ 


if(nDist >= 6)// 正 半 周 
{ 


pTransArea[nDist*nMaxAngle + nAngle] ++; 


J 
else / / 4 `É JJ 
l 
nDist = fabs(nDist); 
pTransArea[nMaxAngle * nMaxDist + nDist*nM 
axAngle + nAngle| ++; 


J 
}//for nAngle 


了 LT 
}//for j 
}//for i 


SMaxValue MaxValue1; 


/ OAZ A ЛЕЛ BJ gu, Н] 
int nMaxDisAllow = 20; 
int nMaxAngleAllow = 5; 


for(int nLine=0; nLine<nLineRet; nLine++) // 寻 找 表 nmnL 
ineRet 个 峰值 点 


l 
// 寻找 最 大 所 
MaxValue1.nValue = Ө; 
for(i=0; i<nAreaNum; i++) 
{ 
if(pTransArea[i] > MaxValuel.nValue) 


MaxValue1.nValue pTransArea[ il]; 
MaxValue1.nAngle = i; 


} 


} 
if(MaxValuel.nValue == 0) // 找 不 到 可 能 的 共 线 点 
l 
return FALSE; 
} 
if(MaxValuel.nAngle < пМахАпе1іе * пМахріѕі) 
l 
MaxValuel.nDist = Мах\а1ие1 . пАпе1е/пМахАпр1е; 
MaxValuel.nAngle = Мах\№а1ие1 . пАпрІе%пМахАпе1е; 
} 
else 
l 


MaxValue1.nAngle -= nMaxAngle * nMaxDist; 


MaxValuel.nDist = Мах\а1ие1 . пАпе1е/пМахАпр1е; 
Мах№а1ие1.п0151 *= -1; 


MaxValuel.nAngle = Мах\аіие1. пАпе1е%пМахАпр1е; 
} 


// 将 结果 保存 至 pInfoRet 结 构 指 针 
plnfoRet[nLine].nAngle = MaxValue1.nAngle*2; 
plnfoRet[nLine].nDist = MaxValuel.nDist; 
plnfoRet[nLine].nPixels = MaxValuel.nValue; 


if(pInfoRet[nLine].nDist < е) 
l 
plnfoRet[nLine].nAngle = pInfoRet|nLine ].nAngle 
- 180; 
pInfoRet[nLine].nDist = pInfoRet[nLine].nDist*(- 
1); 


) 


// 将 附近 点 清 零 ， 为 寻找 下 一 个 峰值 做 准备 
for(nDist = (-1)*nMaxDisAllow; nDist <= пМахріѕА11 
ow; nDist ++) 
{ 
for(nAngle = (-1) *пМахАпе1еА110м; nAngle <= пМах 
AngleAllow; nAngle ++) 
{ 
int nThisDist = MaxValuel.nDist + nDist; 
int nThisAngle = MaxValuel.nAngle + nAngle; 


nThisAngle *= 2; 


if(nThisAngle < 0 && nThisAngle >= -180) 
{ 

nThisAngle += 180; 

nThisDist *= -1; 


J 
if(nThisAngle >= 180 && nThisAngle < 360) 
l 
nThisAngle -= 180; 
nThisDist *= -1; 
J 


if(fabs(nThisDist) <= nMaxDist 
&& nThisAngle >= Ө && nThisAngle <= nMaxAngl 
e*2) 
l 
nThisAngle /= 2; 
if(nThisDist >= Ө) 


l 
pTransArea[nThisDist*nMaxAngle + nThisAngl 


e] = 0; 
J 
else 
nThisDist = fabs(nThisDist); 
pTransArea[nMaxDist*nMaxAngle+nThisDist*nM 
axAngle+nThis 


Angle ]=0; 
J 


J 
y//for nAngle 


}//for nDist 
}//for nLine 


delete []pTransArea; // 释 放 极 坐标 域 空 间 


return TRUE ; 


F) H Hough KIK IE RERI TEER AA 
ДЫ] Же ІРррето Т. P ВАА 2 р 25rvoid 
CDIPDemoView::OnEdgeHough() 中 ， 其 中 调用 
Hough() 函 数 的 代码 厂 断 如 下 所 示 。 





// ВАКА 


SLineInfo * рііпеѕ = пем SLineInfolnLineCount |; 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// Hough 变 换 
imgInput.Hough(pLines, nLineCount); 


// 输出 结 
for (int k = ð; k<nLineCount; k++)// 处 理 第 k 条 直线 


l 
/ / Tá S| R 22 l| Н.Ж 
for(int i = Ө; i <imgInput.GetHeight(); i++) 


{ 
for(int j = 0;ј <imgInput.GetWidthPixel(); j++) 
{ 
int п015+; 
// 根 据 theta 计 算 rho 
nDist = (int) (j*cos(plines[k].nAngle*PI/180.0) 
PA 
i*sin(pLlines[k].nAngle*PI/180.0)); 
if (nDist == pLines[k].nDist) // 如 果 点 (j, i) Æ 
和 直线 上 
imgOutput.SetPixel(j, i, RGB(255,255,255)); 
}//for j 
}//for i 
}//for k 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 


上 述 程序 运行 时 会 弹出 对 话 框 要 求 用 户 设 置 希 
望 检测 的 二 线 数目 。 读 者 可 以 通过 光盘 示例 程序 
DIPDemo 中 的 及 时 命令 “网 像 分 割 ~ ERER AAI 
察 处 理 效果 。 对 于 图 像 line.bmp， 设 定 希望 检测 的 


直线 数 为 3 时 的 检测 结果 如 图 12.14 上 所 示 。 





(a) 原 图 像 line.bmp (b) 检测 出 的 3 条 直线 


412.14 ” Hough 变换 和 直线 检测 结果 (检测 3 条 有 直线) 
注意 | 

霍 夫 杰 换 只 能 处 理 二 值 图 像 ， 一 般 在 执行 此 命令 前 需要 首先 在 图 
像 上 执行 边缘 检测 。 
124 国信 分 割 


谈 者 曾 在 3.5 下 和 芝 习 过 灰 度 国信 变换 的 相关 知 
识 ， 利 用 灰 度 国信 变换 分 制图 像 融 称 为 国 什 分割， 
它 是 一 种 葵 本 的 图 像 分 割 方法 。 


出 值 分 割 的 基本 思想 是 确定 一 个 病 值 ， 然 后 把 
每 个 像 系 点 的 灰 度 值 和 病 值 相 比 较 ， 根 据 比 较 的 结 
朱 把 该 像 系 划分 为 两 关 一 前景 或 者 衣 景 。 一 般 来 


说 ， 国 值 分割 可 以 分 成 以 下 3 步 。 

(1) Е ВИН. 

(2) ВИАН HEE. 

(3) 11428. 

其 中 第 1 步 国 值 的 确定 是 最 重要 的 。 国 值 的 选 
择 将 直接 影 啊 分 割 的 准确 性 以 及 由 此 产生 的 图 像 摘 
述 、 分 析 的 正确 性 。 
12.4.1 国信 分 割 方法 

闵 值 分 害 常 用 的 方法 一 般 有 以 下 几 种 。 
1. 实验 法 

实验 法 是 通过 人 有 眼 的 观察 ， 对 已 知 某 些 特征 的 
图 像 ， 只 要 试验 不 同 的 国 值 ， 然 后 看 是 否 满足 已 知 
特征 即 可 。 这 种 方法 的 问题 是 适用 范围 符 ， 使 用 前 
必须 事先 知道 图 像 的 某 些 特征 ， 壁 如 平均 灰 度 等 ， 
而 且 分 制 后 的 图 像 质 量 的 好 坏 受 主观 局 限 性 的 影 啊 
很 大 。 
2. 根据 直方 图 谷 撒 确定 国信 


ЩИ R 1 BJ Bi RAA A PE IS p: X Pk [К] Zk J E 
TARABE RYJ, JE2Z 6 1 0k: Н. Л УА 
A НН TNIE, ERTE, ДЕ р Z [BE] BJ $ç JS TE М 
值 ， 如 图 12.15 所 示 。 


T 
412.15 WWA ED SISA E ЇН 
其 表达 式 为 : 


[255 f(x,y)= T 
а(х) = + Tg 
[0 (ху)<Т 


(12-22) 


其 中 ，g ORES Sr Ji НЛА Ж. 


此 种 单 国 值 分 割 方 法 徐 单 多 操作 ， 但 是 当 两 个 
蜂 信 相差 很 还 时 不 适用 ， 而 且 ， 此 种 方法 比较 容易 
党 到了 噪声 的 影响 ， 进 而 导致 贺信 选取 的 误 委 。 


对 于 有 多 个 峰值 的 直方 图 ， 可 以 选取 多 个 阔 
值 ， 这 些 阔 值 的 选取 一 般 没 有 统一 的 规则 ， 要 根据 
实际 情况 运用 ， 如 图 12.16 所 示 。 


Т, Í 1» 


412.16 ”多 峰值 直方 网 确定 净值 





y — 
注意 


由 于 直方 图 是 各 灰 度 的 像素 统计 ， 其 峰值 和 谷底 特性 不 一 定 代表 
目标 和 背景 。 因 此 ， 如 果 没 有 图 像 其 他 方面 的 知识 ， 只 靠 直方 图 进行 
图 像 分 割 是 不 一 定 准确 的 。 


3. ANRE TE N EYA 


EARRA BA ETAREN АДЫ ДЕ: 开始 选择 
АЛАТЕ УЈИЕ, ХЕШ S RB AND A r 


地 更 新 这 一 估计 值 ， 下 到 满足 给 定 的 条 件 为 止 。 这 
个 过 程 关 键 得 是 选 挤 怎 么 梓 的 和 欠 代 规则 。 一 个 好 的 
运 代 规 则 必须 既 能 够 局 速 收 伊 ， 义 能 够 在 每 一 个 友 
Ка Е НИ Г ИКАТ. КЕ 
运 代 选择 国信 算法 。 

(1) 选择 一 个 T 的 初始 估计 值 。 


(2) 利用 羡 值 了 把 图 像 分 为 两 个 区 域 R 1 MR ， 


(3) КАР 1 MR j 中 的 所 有 像 系 计算 平均 办 
Zp 1 рә 。 


(4) 计算 新 的 国信: 
Г = (и + рә) 
(12-23) 


(5) 重复 步 台 (2) ~ (4) ， 直 到 逐次 迭代 
所 得 的 了 值 小 于 事先 定义 的 参数 了 。 


4. Ж/М) 
ЖЕ EJ АН де н H BHEN ENEL — o 


这 种 方法 通 冲 以 图 像 中 的 灰 度 为 模 陈 特征 ， 假 设 各 
模 陈 的 灰 度 是 独立 分 布 的 随机 变量 ， 并 假设 图 像 中 
行 分 割 的 醒 式 服从 一 定 的 概率 分 布 。 一 般 来 说 ， 采 
用 的 是 正 态 分 布 ， 即 高 斯 概率 分 布 。 


自 完 假设 一 幅 图 像 仪 包含 两 个 主要 的 灰 肛 区 域 
— HJ ТЫ хә z KIRKEE, p(z) 
值 概率 密度 函数 的 估计 从 。 假 设 概率 密度 函数 中 的 
参数 一 个 对 应 于 背景 的 灰 度 值 ， 为 一 个 对 应 于 图 像 
中 前 景 即 对 象 的 灰 度 信 。 则 拍 述 图 像 中 整体 灰 度 变 
换 的 混合 密度 函数 为 ; 


р(х) = Pipi(z) + Р›рэ(®) 
(12-24) 
Я, Ру 是 前 景 中 其 有 值 z MAR h JI HJ B 


Ж, P ,是 背景 中 上 共有 值 z 的 像素 出 现 的 概率 ， 两 者 
的 关系 为 : 


Р, + Р» = ] 
(12-25) 
ИП ЖЕН ШУ ж Я Вёл T Bi Sep at Н ях, W 


Ж зз {Өл Mewe ИЕТ, Е Е 
像素 进行 归 类 。 采 用 最 小 均 方 误差 法 的 目的 是 选择 


ТЕ], EI ТАЕ АИТ ВИО НЈУ 
类 时 出 错 的 概率 最 小 ， 如 图 12.17 所 示 。 


Р, Р, 


S/N 
412.17 NIY Л RYA E RE 


当选 定 国信 了 上 时， 将 一 个 育 景点 当成 前 景点 进 
行 分 关 铬 误 出 现 的 概率 为 : 


FA UT) = f palz)d2 
(12-26) 


当 远 定 网 值 T 时 ， 将 一 个 前 景 扣 当成 至 景点 进 
行 分 类 乌 误 出 现 的 概率 为 : 


JT 


(12-27) 


ЕГ) = PET) + РР(Т) 
(12-28) 


БУР JAB T, Е (T )X T Ж 
ЭЕ аА РО, TEARRE: 


Рур (Т) = Pxpa (T) 
(12-29) 
М ААИ НТ, ШУБЕ ВИН. 
下 面 讨论 如 何 得 到 T 的 解析 式 。 
要 想得到 T 的 分 析 表 达 式 ， 则 十 要 已 知 两 个 符 
及 概率 函数 的 解析 式 。 一 般 假设 图 像 的 前 景 和 否 景 


的 灰 度 分 布 痢 应 足 正 态 分 布 ， 即 使 用 局 斯 密度 概率 
函数 。 此 时 ， 


(12-30) 








(12-31) 
фта? = o = оз? , 则 单一 国信 : 
MTH ， т” (а 
= 2 И щт, (2) 
(12-32) 


#P =P  =0.5, MEERE EEM FIA, 
即位 于 曲线 p 1 (z )#llp > (2) Оё RA: 


r — №1 + В 
с) 


(12-33) 
一 般 来 讲 ， 确 定 能 使 均 方 误差 最 小 的 参数 很 复 
杂 ， 而 上 述 讨论 也 在 图 像 的 前 景 和 背景 都 为 正 态 分 


MIIR FRAZ. (Не, RAII НТР хе ТТ ЙК 
为 正 态 分布 ， 也 和 古 一 个 上 共有 挑 成 性 的 问题 。 


5. ж Хан] 27 21А 


ТЕХТ ВИЕ 27 ИУ, Z E ЖШН ЛУ 
SERI з ЈР ЛЫ ЖЛЕ, a ЕККУ АЛУ Ha e 


幅 图 像 的 平均 灰 度 之 间 甜 别 最 大 ， 这 种 差异 用 区 域 
的 方差 来 表示 。 由 此 ，Otsu 在 1978 年 提出 了 最 大 方 
天 法 。 设 算法 在 判决 分 析 最 小 二 滋 法 原理 的 基础 上 
推导 得 出 ， 计 算 价 单 ， 是 一 种 稳定 、 和 间 用 的 算法 。 


Ww rH KJE NKI НИЗ Уп; ”, KEWENN 
[0, 工 -1]， 则 总 的 像素 数 为 : 


(12-34) 
各 灰 度 值 出 现 概率 为 : 
(12-35) 
X Fpi; A: 
5н. 
(12-36) 


把 图 中 的 像 系 用 网 值 T 分 成 两 尖 Co ЖС 1, Со 


由 灰 度 值 在 [0, T-1] 的 像素 组 成 ，C 1 由 灰 度 值 在 [了 ， 
L -1] 的 像 取 组 成 。 则 区 域 Co 和 C у 的 概率 分 别 为 : 





(12-37) 
-a =1—Р, 
(12-38) 
区 域 Co 和 C 1 的 平均 灰 度 分 别 为 
An 一 Эў _ -一 
(12-39) 
(12-40) 


其 中 , и лел |M КЖ ВРК: 


L—1 :—1 1—1 


и = > ip; = > ipi + > ір; = Popo + Pipi 


i=0 1—0 Т 


(12-41) 
两 个 区 域 的 总 方差 为 : 
ов? = Polpo—p) + Pl-p) = PP(po— ш)? 
(12-42) 


LET 10, 工 -1] 学 围 内 依 砍 取 值 ， 使 za 最 大 有 的 
T (ENE zE Е Ж 27] Ж ИН o 


该 方法 不 需要 人 为 设 定 其 他 参数 ， 古 一 种 目 动 
选择 国信 的 方法 ， 而 且 能 得 到 较 好 的 结 未 。 写 个 仅 
适用 于 包含 两 个 区 域 的 日 浆 值 选择 ， 也 同样 运用 于 
20 [х 07 Z ВИНЕ. 


12.4.2 MATLAB 实 现 
1. RAŽ DAE 

MATLAB 中 和 病 值 变换 相关 的 两 个 主要 函数 是 
im2bw() 和 graythresh()。 实 际 上 ，graythresh0 〇 函数 即 
实现 了 12.4.1 小 节 介 绍 的 最 大 类 间 方 天 法 。 它 们 的 
用 法 在 3.5.2 小 节 有 详细 的 介绍 ， 这 里 不 再 获 述 。 
2. 壕 代 选择 病 值 法 


ШЖ SIRA s КОЕ IS] B 72 Ji H ZJ Б BJ 
MATLAB%  ашоТЊеѕһо!а(), €M FME 12762 
HJ“chapter12vcode” Н xF- 


function [Ibw, thres] = autoThreshold(I) 
% ААА 3JJ R| IB. 27 ë| 


输入 : I - НУ ИА НЛК 2 
输出 : Ibw - 分 割 后 的 二 值 图 像 
thres - 目 动 分 割 采 用 的 国信 


SS XN XN XN 


thres = 0.5 * (double(min(I(:))) + double(max(I(:)))); 
%4 AR Н. 
done = false; % 结 束 标 志 
while 一 done 
g = І >= thres; 
Tnext = @.5 * (mean(I(g)) + mean(I(~g))); 
done = abs(thres - Tnext) < 0.5; 
thres = Tnext; 
end; 


Ibw = im2bw(I, thres/255); % 二 值 化 





TAA = 15) НашоТћгеѕһо]а() р ХУ 
MATLAB Ý E Blíž соіпѕ.рпо 47 Н SJ BEAS šJ BU il 
用 示例 。 





f = imread('coins.png'); А 
[Ibw, thres] = autoThreshold(I); 
imshow(Ibw) % 得 到 图 12 .18 

thres % 显 示 所 用 靖 值 


thres = 
126.0522 


上 述 程序 的 运行 绪 末 如 图 12.18 所 示 。 





412.18 ASIN PETA HJ Fl ЭЕ ЇН 27 #n| Zñ 


12.4.3 Visual C++ 实现 


CImgProcess 关 中 有 3 个 和 国信 分 割 相关 的 函数 
DetectThreshold()、Threshold() 和 Auto- 
Threshold( )。 





(1) DetectThreshold 方 法 利用 欠 代 选择 国信 法 
寻找 合适 的 分 割 国信。 


(2) Threshold 方 法 根据 指定 的 国 值 对 图 像 进 
行 国 全 化 分 割 。 


(3) AutoThreshold 方 法 用 于 对 图 像 进 行 日 动 
国人 分割 ， 实 际 上 是 对 上 述 两 个 方法 的 封 痛 。 


1. DetectThreshold 方 法 


DetectThreshold 方 法 利用 和 欠 代 选择 国信 法 目 适 

应 地 寻找 最 佳 分 割 浆 值 。 为 防止 由 于 图 像 中 像 系 过 

多 而 导致 计算 平均 灰 度 全 时 所 需 内 存 空 间 过 大 ， 首 

先 对 图 像 计 算 灰 虐 和 且 方 图 ， 而 后 束 可 以 退 过 计算 下 

ч нана И ЫЕ FES 
jj 计算 o 


DetectThresholdO0 函 数 的 完整 实现 如 下 。 





оаа ааа 


int CImgProcess::DetectThreshold(int nMaxIter, int &прі 


ffRet) 

功能 : A HIRI B amA E RE 

参数 : int nMaxIter: 最 大 迭代 次 数 

А к &nDiffRet: 使 用 给 定 国 值 确定 的 亮 区 与 蜡 区 平均 灰 度 的 
AR] 


返回 值 ， intK®, RAHTI E AI RE 


ОО ТОРЕШ ЕЕЕ ЕКЕ К ЖОЕ ЕЕ ЕЛЕЕ КУЕ ККЕ ЕК ЕЕ 


int CImgProcess::DetectThreshold(int nMaxIter, int &nDi 
ffRet) 


int nThreshold; 


nDiffRet = 0; 


// ЕЗЕН 
int nHistogram[256] = í Өө }; 
int і, J; 


BYTE bt; 


int nMin = 255; 
int nMax = 0; 


// AWER, MAERA КЕЕ J B 
for(j = 0; j < GetHeight(); j ++) 
l 

for(i=0; i<GetWidthPixel(); i++) 


{ 
bt = GetGray(i, j); 


if(bt < nMin) 
nMin = bt; 

if(bt > nMax) 
nMax = bt; 


nHistogram[|bt] ++; 


) 
} 


int nTotalGray = Ө; // 灰 度 值 的 和 

int nTotalPixel = 0; // ЈА 

int пМемТһгеѕһо1а = (nMax + пМіп)/2; // 初 始 国 值 
nDiffRet = пМах - пМіп; 


if (nMax == mMin) 


nThreshold = nNewThreshold; 
else 
nThreshold = 0; 


// 576, Вр KO 0А Loona ЖН У Е 2649 20 
БЕЛИ =, АТМАК 

for(int пІёегаёіопТітеѕ = Ө; nThreshold ! = nNewThr 
еѕһо1а && nIterationTimes< nMaxIter; nIterationTimes ++ 


) 


l 
nThreshold = nNewThreshold; 


nTotalGray = Ө; 
nTotalPixel = ð; 
// Ж КИ P hF НГЕН Р НЧЕ J E 
for(i=nMin; i<nThreshold; i++) 
{ 
nTotalGray += nHistogram[i]*i; 
nTotalPixel += nHistogram|i]; 


J 
int nMean1GrayValue = nTotalGray/nTotalPixel; 


nTotalGray = ө; 
nTotalPixel = 0; 


// 计 算 图 像 中 大 于 当前 国信 部 分 的 平均 灰 度 
for(i=nThreshold + 1; i<=nMax; i++) 
l 
nTotalGray += nHistogram[i]*i; 
nTotalPixel += nHistogram|i]; 


J 
int nMean2GrayValue = nTotalGray/nTotalPixel; 


nNewThreshold = (nMean1GrayValue + nMean2GrayVal 
ue)/2; //vFLrH S| HJ BB 

nDiffRet = abs(nMean1GrayValue - nMean2GrayValue 
); 


return nThreshold; 





2. Threshold ZZ 


Threshold() р 7 5ë 至 实现 和 调用 方法 请 参见 
3.5.32 T, 这 里 不 再 葡 述 


3. AutoThreshold 方 法 


AutoThresholdO 函 数 的 相关 调用 代 公 如 下 。 





ааа а 


void CImgProcess::AutoThreshold(CImgProcess *ртТо) 
功能 : 图 像 的 目 动 国 人 化 


参数 : CImgProcess * pTo: 输出 CImgProcess 对 象 的 指针 
返回 值 ， Ж 


a Е u K s / 


void CImgProcess::AutoThreshold(CImgProcess *pTo) 
l 

int nDiffGray; 

int nThres = DetectThreshold(100, nDiffGray); // 取 得 分 
ИН, EARRAN 


Threshold(pTo, nThres); // BL ml 
J 


F| H AutoThresholdO p ЗЕЛ, А 2JJ IR] E 27 81) 
TIME (EDIPDemo TFE F ВУХА ЕЧ рк 27 
void CDIPDemoView::OnEdgeAutothre() 中 ， 其 中 调 
H AutoThreshold( K HJ KS АТАП . 


// 输出 的 临时 对 象 
CImgProcess imgOutput = imgInput; 


// ВИН 
imgInput.AutoThreshold(&imgOutput); 


// 将 结果 返回 给 文档 类 
pDoc->m Image = imgOutput; 





读者 可 以 通过 光盘 中 示例 程序 DIPDemo 中 的 菜 
单 命 令 “ 图 像 分 割 > 自动 国 值 分 割 ” 来 观察 处 理 效 
j. 


12.5 ”区 域 分 割 


前 和 面 所 讲 的 图 像 分 割 方法 部 十 基 于 像 系 的 灰 度 
来 进行 国人 分 割 ， 本 节 将 讨论 以 区 域 为 基础 的 图 像 
DER. ERAKIRI HIT AA K EE KA X Ek 


分 裂 与 合并 ， 其 中 最 基础 的 是 区 域 生长 法 。 
12.51 区域 生 长 及 其 实现 

区 域 生 长 是 根据 事先 定义 的 准则 将 像 系 或 者 子 
区 域 肾 合成 更 大 区 域 的 过 程 。 其 基本 思想 古 从 一 组 
жка СЕКА ЦЕНА, ау 
№), БАЕК ЕЛАН АУН E 
者 区 工 与 生长 点 合并 ， 形 成 新 的 生长 点 ， 重 复 此 过 
程 直 到 不 能 生长 为 止 。 生 长 点 和 相 邻 区域 的 相似 性 
判 据 可 以 是 灰 度 值 、 纹 理 、 闫 色 等 多 种 图 像 信 息 。 
1. 区 域 生长 算法 

区 域 生 长 一 般 有 以 下 3 个 步骤 。 

(1) 选择 合适 有 的 生长 点 。 

(2) 人 确定 相似 性 准则 即 生 长 准则 。 

(3) 确定 生长 俘 止 条 件 。 


RR, EAR RE KR EMAER 
域 的 条 件 时 ， 区 域 生长 融会 停止。 


图 12.19 给 出 一 个 区 域 生 长 的 实例 。 图 
12.19 (а) 为 原 图 像 ， 数 字 表 示人 像素 的 灰 度 。 以 灰 


度 为 8 的 像素 为 初始 的 生长 点 ， 记 为 G, j) 。 在 
8 邻 域内 ， 生 长 准则 是 待 测 点 灰 度 值 与 生长 点 灰 度 
值 相差 为 1 或 者 0。 那 么 ， 如 图 12.19 (b) 所 示 ， 第 
1 次 区 域 生 长 后 , 了 (i-1,j7)、f Gi,j-1) 、F A 
j+1) 与 中 心 点 灰 度 值 相 差 都 为 1， 因 而 被 合并 。 第 
2 次 生长 后 ， 如 图 12. 19 (c) 所 示 , f (i+1,j) 被 
е 第 3 次 生长 后 ， 如 图 12.19 (d) 所 示 , f Gi 

ј-1) a f (i+2,j) 航 合 并 ， 人 至此， 已 经 不 存在 
ЫЛ КОШИ А, +С ШЕ 


4 3 7 % 3 4 3 (7) 3 3 
I 7 (9 7 5 1 (7) (8) (7) 5 
0 5 6 1 3 0 5 6 1 3 
2 2 6 0 4 2 2 6 0 4 
I 2 1 3 1 I 2 1 3 1 


(а) ERAK EEk O) 第 1 次 区 域 生 长 结果 


4 3 D) 3 3 4 3 M 3 3 
1 (7) (8) (7) 5 1 (7) (8) (7) 5 
0 5 © 1 3 0 (5) (6) 1 3 
2 2 6 0 4 2 2 (© 0 4 
Io 2 1 3 1 i Š 4 3 1 


(c) 第 2 次 区 域 生长 结果 (b) 第 3 次 区 域 生 长 结果 
41219 ”区 域 生长 示意 图 


EHRT AE Н ЛЖ жє ЖИИ ЖЛЕ}? 
ПЕ 11 ЭЛЕ ТЄ, В PH Cr АЫ PC НЕС» TD 
КИТАБИ ЈУ 0, ЕИН ИХ Р Ek HAHA 
МЕ, ЖН S JE, ÆR, KREK 
Мр АЈ ISI“ E”, KEIR ha | k] КГ, 
形状 等 图 像 的 全 局 性 质 来 决定 区 域 的 合并 。 


2. MATLAB 实 现 


КА А T hh f лд8-ФИЫ [Хх k zF < EL 
法 的 MATLAB 实 现 ， 它 位 于 随 书 光盘 
Hj“chapterl2\code” 目 录 下 有 的 regionGrow.m 文 件 中 。 


function J = regionGrow(I) 

% 区 域 生 长 ， 需 要 以 交互 方式 议定 初始 种 子 点 ， 县 体 方 法 为 单 击 图 像 
中 一 点 后 ， 按 下 回 车 键 

X 
X 
X 


о 
о 


输入 : І - 原 图 像 
输出 : J - 输出 图 像 


if isinteger(I) 

I=im2double(I); 
end 
figure,imshow(I),title(' 原 始 图 像 ') 
[M,N]=size(1I); 


[y,x]=getpts; AIR IF X BR E ТЄ Жайны, 

x1=round(x); БЛ МАЛ HY ЯК 

у1=гоипа(у); % 纵 坐标 取 整 

ѕееӣ=1(х1,у1); % 将 生长 起 始点 灰 度 值 存 入 seed 中 
J=zeros(M,N); Е 2 = Bj Ji И ЖЕЛЕ ВЕ 
， 作 为 输出 图 像 窍 阵 

7(х1,у1)=1; % 将 J 中 与 所 取 点 相对 应 位 置 的 点 设置 为 
日 

ѕит=ѕееа; % 储 存 符 合 区 域 生 长 条 件 的 点 的 灰 度 值 的 
和 

suit=1; % 储 存 符 合 区 域 生 长 条 件 的 点 的 个 数 
count=1; % 记 录 每 次 判断 一 点 周围 八 点 符合 条 件 的 
新 点 的 数目 

threshold=0.15; % 国 值 ， 注 意 需 要 和 doub1le 类 型 存储 的 图 
像 相 符合 


while count>90 
s=0; % 记 录 判 断 一 点 周围 八 点 时 ， 人 符合 条 件 
的 新 点 的 灰 上 度 值 之 和 


count=0; 
for i=1:M 
for j=1:N 
л. )у= ет 
if (i-1)>@ & (i+1)<(M+1) & (j-1)>0 & (j+1)<(N+ 
1) ЖИ кале тт УЧИО У ЕН 
for u= -1:1 %1 ИЛ 
АЛ ЕВ] JN Але r er ЇН ЖЇР 
for v= -1:1 
if J(i+u,j+v)==0 & abs(I(i+u,j+v)-seed)<= 
threshold& 1/(1+1/15*abs(I(i+u, 
j+v)-seed))>0.8 
J(i+u,j+v)=1; 


AFER у а, HEITE ЕН 2& #F BJ 


占 
% 从 合 以 上 两 条 件 即 将 其 在 J 中 与 之 位 置 对 应 的 
点 设置 为 日 
count=count+1; 
s=s+I(i+u,j+v); ЖШ Sa 
的 灰 度 之 加 入 s 中 
end 
end 
end 
end 
end 
end 
end 
suit=suit+count; % 将 n 
加 入 人 符合 点 数 计数 硕 中 
sum=sum+s ; % 将 
s 加 入 符合 点 的 灰 度 值 总 合 中 
seed=sum/suit; Алп 
ЕЛ НУ КРЕ ГЫН. 


епа 


ШШ У Н геріопСтгоу() K ZT 
MATLAB 内 置 图 像 coins.png 进 行 基于 种 子 点 的 区 域 
生长 的 调用 示例 。 


= imread('coins.png'); 
= regionGrow(I); 


>> figure,imshow(J), title(' 27] 44 ') 





上 述 程序 运行 后 ， 会 弹出 一 个 包含 原 图 像 的 窗 
口 ， 用 户 可 以 用 鼠标 在 其 中 选取 一 个 种 子 点 并 按 
下 “Enter 键 ， 之 后 会 出 现 分 割 结 打 ， 如 图 12.20 所 


— 


/]у о 
原始 图 像 分 割 后 图 像 





(a) 原始 图 像 (b) 区 域 生长 结果 
41220 ”区域 生长 算法 示例 


з. KiE KAYA Visual C++ 实现 


CImgProcess 类 中 的 区 域 生 长 算法 为 
RegionGrow()， 它 从 初始 的 种 子 点 开始 ， 隶 一 判断 
8- 邻 域 的 点 是 人 否 符 合 相 似 国 值 条 件 ， 如 条 人 符合 条 
件 ， 则 将 其 在 目标 图 像 中 标记 为 日 色 (255)〉 ， 反 
之 则 忽略 它 。 而 后 ， 算 法 则 对 增长 的 标记 区 域 边 寞 
上 的 每 一 个 点 执行 相同 的 操作 ， 和 直到 所 有 的 边 毕 点 
的 8- 邻 域 都 不 符合 相似 国人 条 件 。 


RegionGrow() 函 数 的 完整 实现 如 下 。 


下 
BOOL CImgProcess::RegionGrow(CImgProcess * pTo , int ns 
eedX, int nSeedY, BYTE bThre) 
功能 区域 生长 算法 
参数 ” cImgProcess*pTo ”指向 输出 图 像 的 指针 

int nSeedX,intnSeedY 种 子 点 的 坐标 值 

BYTE bThre ЕЕ ÉIRE 
返回 值 ” 布尔 类 型 ，TRUE 为 成 功 ，FALSE 为 失败 
和 
BOOL CImgProcess::RegionGrow(CImgProcess * pTo , int ns 
eedX, int nSeedY, BYTE bThre) 


if (m pBMIH->biBitCount!=8) return FALSE; 


if ((nSeedX<0)||(nSeedX>GetWidthPixel())) return FA 
LSE; 

if ((пЅееЯү<0) | |(nSeedY>GetHeight())) return FALSE; 

pTo->InitPixels(0); 

pTo->SetPixel(nSeedX, nSeedY, RGB(255, 255, 255)); 

// 生长 起 始点 灰 度 

BYTE bSeed = GetGray(nSeedX, nSeedY); 

// ER XIRA 2 П 


long int lSum = bSeed; 
// 生长 区 域 的 点 总 数 和 每 次 八 邻 域 中 符合 条 件 点 个 数 
int nSuit = 1, nCount = 1; 
// 开始 区 域 生 长 循环 操作 
while (nCount > Ө) 
{ 
nCount = 0; 
for (int 1=1; i<GetHeight()-1; i++) 


{ // AW 
for (int j=1; j<GetWidthPixel()-1; j++) 
{ // ЛА 
if (pTo->GetGray(j, i)==255) 
{ ЕА 


// 开始 邻 域 扫 插 


for (int m=i-1; m<=i+1; m++) 
for (int n=j-1; n<=j+1; п++) 
l 
// 判断 是否 符合 国 值 条 件 且 未 标记 


if ((pTo->GetGray(n, m)==0)&&(abs(GetGra 
y(n, m)-bSeed) 


<=bThre)) 
{ 
pTo->SetPixel(n, m, RGB(255, 255, 255)) 
; 
nCount++; 
lSum += GetGray(n, m); 


nSuit+= nCount; 
// ЖАЯТ fd СШ H С А y B ЖЕЗ L bau PC Ek 
HJ J 2k JS ) 


bSeed = lSum/nSuit; 


return TRUE; 


) 





[Хх ЖЕ ча < ШШШ БУ РЁ Ж ZJvoid 
CDIPDemoView::OnEdgeRegionGrow()， 实 现 如 
下 о 


void срІРрето\іем: : ОпЕареВеріопбгом( ) 


// 区 域 生长 
AfxMessageBox((LPCTSTR) "双击 图 像 中 的 区 域 以 设 定 区 域 生 长 


起 始点 。"); 
m_bLBtnDblClkSrv = 1; // 置 1 使 得 双击 消息 触及 区 域 生 长 


} 





ИЕЛ ТЕА Н ЕЕН РЕ R 
Е Е ВЈАУ A, KRR т ar 
m_bLBtnDbICIkSrv 81, JE ХХ |х bak #E 
| 


ХІ) Н КеріопСгом() KRE H Н 5) RUB 27 81 7 5с 
整 示 例 被 封装 在 DIPDemo 工 程 中 的 视图 类 函数 void 
CDIPDemoView::OnLButtonDblClkO 中 ， 其 中 调用 
КеріопСгоу() рк 21КА АТ РТУ o 


CDlgPointThre * dlgPara; // 参数 对 话 框 
CImgProcess imgOutput = imgInput; // 输出 的 临时 对 象 


switch (m bLBtnDblClkSrv) 


l 

case Ө: 
һгеаК; 

case 1: 
// 国信 
BYTE bThre; 
// 初始 化 对 话 框 和 变量 
dlgPara = new CDlgPointThre(); 
dlgPara->m bThre = 16; 
// ERRE, Jen Г! ое IRB 
if (dlgPara->DoModal() != ТООК) 
l 

return; // 返回 
} 
// ЗАЯ P охе НИВ 
bThre = dlgPara->m_bThre; 
// 删除 对 话 框 
delete dlgPara; 
// 执行 区 域 生 长 
imgInput.RegionGrow(&imgOutput, point.x, point.y, 
bThre); 

break; 

default: 


AfxMessageBox((LPCTSTR) "错误 的 参数 设置 ， 检 查 设 定 的 服 
务 参数 "); 
J 


pDoc->m_ Image = imgOutput; 


r HJ РДАШЧ Ж УК ЙЛ ДЕЛШ Р Оешто!Н HJ 2 
о {#27 ЕКСА ДЖ» A 
行 此 命令 时 ， 需 要 双击 图 像 中 的 菜 点 以 给 定 生 长 起 
始点 ， 并 给 出 网 值 参 数 。 


12.5.2 ”区 域 分 忽 与 合并 及 其 MATLAB 实 
现 


区 域 生 长 是 从 一 组 生长 点 开始 的 ， 太 一 种 方法 
征 在 开始 时 将 图 像 分 割 为 一 系列 任意 不 相交 的 区 
域 ， 然 后 将 它们 合并 或 者 拆 分 以 满足 限制 条 件 ， 这 
束 古 区 域 分 错 与 合并 。 通 过 分 锦 ， 可 以 将 不 同 特征 
с" 而 通过 合并 ， 将 相同 特征 的 区 域 合 
oy 


1. КЫЛ УРА 


(1) DR. ФЕ 表示 整个 图 像 区 域 ,，P RRK 
种 相似 性 准则 。 一 种 区 域 分 铁 方 法 是 自 先 将 图 保守 
分 为 4 个 区 域 ， 然 后 反复 将 分 割 得 到 的 子 图 像 再 次 
分 为 4 个 区 域 ， 直 到 对 任意 Ri Р (Ri) =TRUE， 
表示 区 域 玉 已 经 满足 相似 性 准则 《和 艾 如 说 该 区 工 凡 


的 灰 度 值 相等 或 相近 ) ， 此 时 不 再 进行 分 裂 操 作 。 
WRP (R; ) =FALSE， 则 将 R; 分 割 为 4 个 区 域 。 如 
此 继续 下 去 ， 直 到 P (R) =TRUE 或 者 已 经 到 单个 
像 尿 。 这 个 过 程 可 以 用 四 又 树 形 陈 表 示 ， 如 图 12.21 
所 示 。 


其 中 图 12.21 (а) 中 未 标 出 的 4 个 区 域 分 列 为 R 


411` Ёд ` R413 PR 414 。 





(а) 被 分 割 的 图 像 (b) 对 应 的 四 叉 树 
41221 四 叉 树 算法 示意 图 

(2) 合并 。 在 分 离 之 后 ， 结 果 中 一 般 会 包含 
具有 满足 相似 性 的 邻近 区 域 ， 这 束 需 要 将 满足 相似 
性 条 件 的 相 邻 区 域 进 行 合 并 。 

可 在 分 裂 完 成 后 ， 也 可 在 分 裂 的 同时 ， 对 具有 
相似 特征 的 相 邻 区 域 进 行 合 并 。 一 种 方法 是 将 图 像 
中 任意 两 个 具有 相似 特征 的 相 邻 区 域 R 、Rk 合 


并 ， 即 如 果 P (Rj U Rk )=ТКОЕ, IS ER , Rk. 


合并 的 两 个 区 域 可 以 大 小 不 同 ， 即 不 在 同一 层 。 当 


无 法 再 进 行 聚 合 或 拆 分 时 操作 停止。 


一 个 区 域 分 裂 与 合并 的 实例 如 图 12.22 所 示 。 


ттт 


(а) 5104551 (b) 第 2 次 分 裂 (с) 第 3 次 分 裂 (d) 合并 


图 12.22 区域 分 裂 与 合并 


图 像 先 分 裂 为 如 图 12.22 (а) 所 示 的 区 域 ， 第 
二 次 分 裂 时 ， 如 图 12.22 (b) 所 示 ， 由 于 左下 角 区 
WIEP (Ri) “TRUE, MAHITI RENE; 第 三 
次 分 裂 时 ， 如 图 12.22 (с) 所 示 ， 仅 仅 右 边 的 突出 
部 分 P (Ri )=FALSE， 需 要 进行 分 裂 操 作 ， 其 余 不 
T, ERA TRIZ; wa, HAANS AKERS 
行 合并 ， 一直 得 到 最 后 的 结果 ， 如 图 12.22 (d) 所 
7. 


区 域 分 裂 与 合并 对 分 割 复 杂 的 场景 图 像 比 较 有 
效 ， 如 果 引入 应 用 领域 知识 ， 则 可 以 更 好 地 提高 分 
TEN 


2. 区 域 分 裂 的 MATLAB 实 现 


人 在 MATLAB 中 ， 和 区 域 分 忽 相 关 有 的 3 个 主要 也 
数 是 qtdecomp()、gtgetblk() 和 gtsetblk()。 


(1) аїйесотр() ЖЖ МАТТ,АВЛРТ& Ж 
qtdecomp() PI РТ U Y. yf. РАУ н ЛЕ 
像 划 分 成 相等 大 小 的 4 块 ， 然 后 对 每 一 个 块 进行 一 
MERA: WRZE ATA BUERE, MKIZE 
继续 分 为 4 块 ; 否则 不 对 其 进行 进一步 的 分 割 。 这 
个 过 程 将 会 一 二 重复 百人 至 每 一 个 块 都 符合 一 致 性 标 
E, TERARI EZARTEA ERR. 


qtdecomp() PK 17% НУХ] H EAU К. 


S= qtdecomp(I ,threshold,[mindim maxdim]) 


参数 说 明 : 


• threshold ÆT EIRT ERP AFAIRE, SAA 
E0; WRTA Кл ТИЈ ж ЖЇН. 
T ВИНА А дЕ S MER; 对 于 double 
WIERE, threshold ВЕ 70И; ШАГ 
uinit8#lluint162S 7 MERE, threshold K4 LA 
2554065535 LEN KERRE; ГЕ, 
threshold H А z, |5021; 

[mindim , maxdim |Æ 18; mindim 参数 可 
DA DEM R ОЧ VJ L. s Fmindim 的 子 块 的 处 
JE, IA wD a THA nE ЕКИ: 如 


未 参数 形式 为 [mindim , maxdim ]， 则 表示 不 产 
生 小 于 mindim 尺 及 的 子 块 ， 也 不 保留 大 于 
maxdim RÆTT Ek, Ш тахаіт /mindim 必须 
是 2 的 整数 次 虹 。 


返回 值 : 


。5 Е ЛЕЕ, ЕРЕН БАР 
块 的 大 小 。 


下 面 的 程序 给 出 了 对 图 像 I 的 四 又 树 分 解 结果 
FERES 。 


л e UNO Ú 


20 22 20 20 9 
20 22 20 20 13 14 15 16]); 
S = qtdecomp(I,.05); ÍTANI NTA ИН 770.05 
disp(full(S)); шус ЖЕГЕ 


4 Ө Ө Ө 4 Ө Ө Ө 
Ө Ө Ө Ө Ө Ө Ө Ө 
Ө Ө Ө Ө Ө Ө Ө Ө 
Ө Ө Ө Ө Ө Ө Ө Ө 
4 Ө Ө Ө 2 Ө 2 Ө 
Ө Ө Ө Ө Ө Ө Ө Ө 
Ө Ө Ө Ө 2 Ө 1 1 
Ө Ө Ө Ө Ө Ө 1 1 


读者 可 以 看 到 ，S 中 的 非 0 元 素 位 于 该 分 块 的 左 
上 角 ， 表 示 块 的 大 小 。 


SEE 


gtdecomp0 〇 函数 主要 适用 于 边 长 是 2 的 整数 次 宽 的 正方 形 图 像 ， 如 
128х128, 512x512， 此 时 分 解 可 一 直 进 行 至 子 块 大 小 为 1x1。 对 于 长 
觉 不 是 2 的 整数 次 暴 有 的 图 像 ， 分 解 可 能 无 法 进行 到 的 。 例 如 ， 对 于 
96x96 的 图 像 ， 将 首先 分 解 为 48x48， 然 后 是 24x24，12x12，6x6， 最 
后 是 3x3， 无 法 再 继续 分 解 。 此 时 必须 指定 mindim 参 数 为 3 或 是 2 的 整数 
次 壤 与 3 的 乘积 。 


(2) qtgetblkO KAŽI. ТЕТЕ И Ra 5 后 ， 逢 
用 IPT 男 数 qtgetblkO 可 进一步 获得 四 叉 树 分 解 后 所 
有 指定 大 小 的 子 块 像素 及 位 置信 息 。 负 用 调用 形式 
И Po 


[vals, r, c] = qtgetblk(I, S, dim) 


参数 说 明 : 


° 为 输入 的 灰 度 网 像 ; 

° Л КЕ 是 经 过 gtdecomp() 函 数 处 理 的 输出 
ZH Ж: 

° dim 是 指定 的 子 块 大 小 。 


j eÉ : 


e vals 是 dim x dim x k WZ ЕЁ , 01 中 所 有 
从 合 条 件 的 子 块 数据 ， 其 中 kk 为 符合 条 件 的 dim 
x dim 大 小 的 子 块 的 个 数 ，vals(:,:,i ) 表 示人 符 合 条 


件 的 第 i 个 子 块 的 内 容 ; 

° r 各 Cc 均 为 列 同 量 ， 分 别 表 示 图 像 I 中 符合 条 件 
THRE EAW GTR) MEE 
索引 ) 。 


下 面 的 程序 用 于 寻找 给 定 图 像 I 中 的 4x4 子 块 ， 
并 返回 每 个 子 块 的 起 始 反 坐标 。 


8 
/ 
/ 
4 
8 


20 22 20 20 9 10 11 12 
22 22 20 20 13 14 15 16]; 
S = qtdecomp(I,5); % + -Ғаоибіе І, Ж 51E X BEHET 
四 又 树 分 解 
[vals,r,c] = qtgetblk(I,S,4) 
size(vals, 3) % 但 看 4*+4 子 块 的 个 数 
ans = 
2 


% 显示 第 1 个 4*4 子 块 内 容 
үуа15(:,:,1) = 
1 1 1 1 


1 1 2 1 


1 1 1 1 

1 1 1 1 
% 显示 第 1 个 4*4 子 块 内 容 
Vals( v yo = 


% желу ВЕН EHE E АЁ} 


[з = 


(3) gtsetblk(O) 逊 数 。 在 将 图 像 划 分 为 子 块 
后 ， 还 需要 使 用 函数 qtsetblkO 将 四 叉 树 分 解 所 得 到 
的 子 氛 中 符合 条 件 的 部 分 全 部 痊 换 为 指定 的 子 块 。 
РЁ ЖЕЕП К. 


J = qtsetblk(I, S, dim, vals) 


参数 说 明 : 


° T УУЛУН) ZK J BRNK; 
° S 是 1 Z£ F qtdecomp() р Р HZ 


° dim 是 指定 的 子 块 大 小 ; 

° vals 是 dim x dim x k WZ ÆR, AE HKE 
换 原 有 子 其 的 新 子 块 信 息 ， 其 中 K 中 
大 小 为 dim x dim J f Ba 4, vals(:,:,i ) 表 示 
要 符 换 的 第 ;个子 块 。 


返回 值 : 
o J 十 经 过 于 英和 普 换 的 新 图 像 。 


下 和 面 的 程序 根据 三 维 数组 newvals 中 的 内 容 符 
换 给 定 图 像 I 中 的 所 有 4x4 子 块 。 


8 
/ 
/ 
4 
8 

22 22 20 20 9 10 11 ы 

22 22 20 20 1з 14 15 16]; 

= qtdecomp(I,5); % X} Ғаооире І, @РД5{Е 5 Ж 1Т 

四 又 树 分 解 


newvals = cat(3,zeros(4) ,ones(4)); ЕА АЈ ру 
J = qtsetblk(I,S,4,newvals) % 根 据 newvals 中 的 内 容 替 换 I 中 大 


小 为 4 的 子 块 
0 0 0 0 2 3 6 6 
0 0 0 0 4 5 6 8 
0 0 0 0 10 15 7 7 
0 0 0 0 20 25 7 7 


P P P= ы 
P P P= ы 
P P P= ы 
P P P= ы 





读者 可 以 看 到 ，[ 中 左 半 部 分 的 两 个 4x4 子 块 分 
别 被 蔡 换 为 0 子 块 和 1 子 块 〈J 的 左 半 部 分 ) а 


Ууз к. 





注意 sizeof(newvals, 3) 上 必须 和 T PI EKNATH +E, A 
dtsetblkO 会 提示 钳 误 信息 。 


一 个 区 域 分 割 的 综合 实例 如 例 12.3 所 示 。 


【 例 12.3】 对 MATLAB 示 例 图 卢 rice.png 进 行 
ПОЗ, FFA BAE OE n Pr Ia RE ВЕЛЕ RE -o 
同时 ， 取 得 所 有 子 块 和 符合 各 种 维度 条 件 的 子 块 数 
H. 


相应 的 MATLAB 实 现代 码 如 下 。 





11 = imread('rice.png'); XZA RRS 
imshow(I1) % 得 到 图 12.23(a) 


% 选 取 浆 值 为 9.2， 对 原始 图 像 进行 四 义 树 分 解 

S = qtdecomp(11,0.2); 

HIRUR НӘ АЕ ЕТЕТ АГИШ Е Е, У Ри11 БА Z 
$2 = #и11(5); 


figure; 
imshow(S2); % 得 到 图 12.23(b) 


ct = zeros(6, 1); % 记 录 子 块 数目 的 列 向 量 


% 分 列 获得 不 同 大 小 块 的 信息 ， 子 块 内 容 你 存在 三 维 数 组 vals1~val 
6 中 ， 子 块 数 日 你 存在 ct 同 量 中 
for ii = 1:6 
[vals{ii},r,c] = qtgetblk(I1,S2,2^(ii-1)); 
ct(ii) = size(vals{ii},3); 
end 





(a) 原始 图 像 (b) 四 叉 树 分 解 结果 
412.23 ”四 又 树 分 解 算 法 


12.6 小结 


图 像 分 割 问 题 是 一 个 十 分 困难 的 问题 。 因 为 分 
制 后 的 图 像 是 系统 目标 的 一 个 函数 ， 所 以 根本 不 存 
在 理想 的 或 正确 的 分 割 |。 


物体 及 其 组 成 部 件 的 二 维 表现 形式 受到 光照 条 
(Е. ЛЕНАР. ХА АРИ. ДЕЧАНА. ЈИ 
Уһ, ЛН ВИЕ A RLE Кп] ë ze 
IRKIT. ІЖ, ЛАС ВЕН MA ER rH li 
取出 哪些 与 物体 识 列 相关 的 初始 信息 。 


唯一 可 以 肯定 的 事情 征 ， 这 一 过 程 将 在 本 质 上 
具有 不 可 其 性 。 示 坚 有 用 的 信息 能 够 彼 抽 取出 ， 但 
同时 也 会 出 现 许多 钳 误 。 因 此 ， 在 任何 应 用 领域 中 
部 不 存在 最 优 解 。 分 割 结 未 的 好 坏 或 者 正 硝 与 合 ， 
目前 还 没有 一 个 统一 的 评价 判断 标准 ， 大 都 从 分 割 
的 视 客 效果 和 实际 的 应 用 场景 来 判断 。 


第 13 章 ”特征 捉 取 

从 本 章 开 始 ， 将 逐步 从 数字 图 像 处 理 向 图 像 识 
别 过 渡 。 严 格 地 说 ， 图 像 特征 提取 属于 图 像 分 析 的 
范畴 ， 是 数字 图 像 处 理 的 高 级 阶段 ， 同 时 也 是 图 像 
识别 的 开始 。 
本 音 的 知识 和 技术 热点 

(1) 常用 的 基本 统计 特征 ， 如 周 长 、 面 积 、 
均值 等 区 域 描绘 子 ， 以 及 直方 图 和 灰 度 共 现 矩 阵 等 
纹理 描绘 子 


(2) 主 成 分 分 析 (Principal Component 
Analysis, PCA) 


(з) 局 部 二 进 制 模式 (Local Binary Pattern, 
LBP) 


本 章 的 典型 案例 分 析 
基于 PCA 技 术 的 人 上 脸 数 据 集 的 降 维 人 处 理 


13.1 ”图像 特征 概述 


众所周知 ， 计 算 机 是 不 认识 图 像 ， 只 认识 数 子 
的 。 为 了 使 计算 机 能 够 “理解 ”图像 ， 从 而 具有 真正 
意义 上 的 “视觉 ?， 本 章 中 将 研究 如 何 从 图 傈 中 近 取 
有 用 的 数据 或 信息 ， 得 到 图 像 的 “ 非 图 像 * 的 表示 或 
手 述 ， 如 数值 、 同 量 和 符号 等 ， 这 一 过 程 束 是 特征 
提取 ， 而 提取 出 来 的 这 些 “ 非 图 像 ”的 表示 或 接 述 就 
征 特 征 。 有 了 这 些 数值 或 同 量 形 却 的 特征 束 可 以 通 
过 训练 过 程 教 会 计算 机 如 何 情 得 这 些 特征 ， 从 而 
使 计算 机 共有 了 识别 图 像 的 本 领 。 


1. ПАНЧЕ 


特征 是 东 一 闫 对 象 区 列 于 其 他 疾 对 象 的 相应 
本质) 特 扣 或 和 尾 性 ， 或 这 些 特点 和 特性 的 集合 。 
特征 是 骨 过 测量 或 处 理 能 够 抽取 的 数据 。 对 于 图 像 
而 主 ， 每 一 幅 图 像 部 具有 人 能够 区 列 于 其 他 类 图 像 的 
自身 特征 ， 有 些 是 可 以 直观 地 感受 到 的 目 然 特征 ， 
如 之 度 、 边 绿 、 纹 理 和 色彩 等 ， 有些 则 是 需要 通过 
变换 或 处 理 才能 得 到 的 ， 如 窍 隆 、 生 方 图 以 及 主 成 


\ Ауу 
分 等 。 


2. 图 像 符 征 的 分 类 
图 像 特征 的 分 类 有 多 种 标准 。 如 从 特征 上 日 身 的 


和 翌 扣 上 可 以 将 其 分 为 两 大 类 : 描述 物体 外 形 的 形状 
特征 ， 以 及 手 述 物体 表面 灰 度 变化 的 纹理 特征 。 而 


从 特征 提取 所 采用 的 方法 上 ， 义 可 以 将 特征 分 为 统 
计 特 征 和 结构 《句法 ) 特征 。 由 于 本 书后 面 的 图 像 
И К ГИУ АЭ], ЛУ ЛАЯ 
却 识 别 的 县 体内 容 。 因 此 本 重 中 也 主要 讨论 图 像 的 
统计 特征 及 其 获取 方法 。 


з. 特征 癌 量 及 其 几何 解释 


第 第 将 某 一 类 对 象 的 多 个 或 多 种 特性 组 合 在 一 
起 ， 形 成 一 个 特征 同 量 来 代表 葬 闫 对象， 如 条 只 有 
单个 数值 特征 ， 则 特征 同 量 为 一 个 一 维 回 量 ; HHH 
是 n 个 特性 的 组 合 ， 则 为 一 个 n Ж ИЕЫ ж» Т 
征 回 量 第 钊 被 作为 识别 系统 的 输入 。 实 际 上 ， 一 
个 n 维特 征 就 是 一 个 位 于 n 维 空间 中 的 点 ， 而 识别 
(分 类 ) 的 任务 就 是 找到 对 这 个 n 维 空间 的 一 种 划 
分 ， 如 图 13.1 所 示 。 在 后 面 各 章 的 讨论 中 ， 一 般 将 
繁 分 类 的 对 象 称 为 样本 ， 将 其 特征 回 量 称 为 样本 
FIE [Н] Ж БИР Ж [н] н 。 











4 4.5 5 59 6 63 Fi To 8 
(a) 三 维 空间 中 的 3 类 三 维特 征 向 量 样本 (b) 二 维 空间 中 的 3 类 二 维特 征 向 量 及 其 上 的 一 种 
可 能 的 划分 


图 13.1 特征 癌 量 的 几何 解释 


比如 说 要 区 分 3 种 不 同 的 总 尾 必 植物 ， 可 以 选 
摔 其 化 办 长 度 和 化 瓣 蜗 度 作为 特征 ， 这 样 葡 以 1 个 2 
维特 征 代表 1 个 植物 对 象 ， 比 如 (5.1, 3.5)。 如 果 再 加 
Paz KJ MIES, MENS Jë JS Ax] 2° Hi 
一 个 4 维特 征 同 量 表示 ， 如 (5.1, 3.5, 1.4, 0.2). 


4. 特征 所 取 的 一 般 原 则 


图 像 识 别 实 际 上 征 一 个 分 关 的 过 程 ， 为 了 识别 
出 未 图 像 所 属 的 关 列 ， 需 要 将 它 与 其 他 不 同 疾 列 的 
图 像 区 分 开 来 。 这 束 要 求 选取 的 特征 个 仪 要 能 够 很 
好 地 描述 图 像 ， 蝎 重要 的 是 偿 要 能 够 很 好 地 区 分 不 
同类 列 的 图 像 。 


操作 者 布 望 选择 那些 在 同类 图 像 之 间 天 弄 较 小 


( 较 小 的 类 内 距 )〉 , ТЕЛУ БЕН) ENA [aj Ж p 32: 
大 《〈 较 大 的 类 间距) 的 图 像 特 征 ， 称 之 为 最 具有 区 
分 能 力 (Most Discriminative〉 的 特征 。 此 外 ， 在 特 
征 提 取 中 先 验 知识 扮演 看 章 要 的 骨 色 ， 如 何 依 徘 先 
Кыш EEE 
J 问题 。 


要 对 某 个 图 像 进 行 分 类 ， 应 如 何 提取 该 图 像 的 
WIERE? 一 个 最 容易 想到 的 方法 是 提取 图 像 中 所 有 
像素 的 灰 度 值 作为 特征 ， 这 样 可 以 提供 尽 可 能 多 的 
信息 给 识别 程序 〈 分 类 器 ) ， 让 分 类 器 具有 最 大 的 
工作 自由 上 度 (基于 神经 网 络 的 很 多 特征 提取 就 是 这 
样 做 的 ， 见 第 15 章 ) „ П, ЕЛАН a YL PEL 
复杂 度 ， 这 为 后 续 的 处 理 和 识别 带 来 了 巨大 的 困难 
( 见 13.3.1 小 节 维 度 灾 难 ) 。 此 外 ， 很 多 时 候 由 于 
操作 者 已 经 掌握 了 有 关 样 本 图 像 的 东 些 先 验 知 识 ， 
使 得 这 种 把 全 部 像素 信息 都 交 给 分 类 器 的 做 法 显得 
没有 必要 。 如 已 经 知道 蛋子 、 肤 色 、 和 面部 轮廓 等 信 
恩 与 表情 关联 不 大 ， 那 么 在 表情 识别 中 束 不 需要 人 
仿照 片 中 的 全 部 信息 。 可 以 只 拿 出 眉毛 、 眼 睛 和 哮 
这 些 表 情 区 工作 为 特征 提取 的 候选 区 ， 这 时 可 以 进 
一 步 在 表情 区 中 提取 统计 特征 。 


5. 特征 的 评价 标准 
一 般 来 说 ， 特 征 提取 应 具体 问题 具体 分 析 ， 其 


评价 标准 具有 一 定 的 主观 性 。 然 而 ， 还 是 有 一 些 可 
供 遵循 的 普遍 原则 ， 能 够 作为 操作 者 在 特征 提取 实 
ЖЕРИНЕ. ДИТ. 


(1) 特征 应 当 容 匈 握 取 。 换 句 话 说， 为 了 得 
到 这 些 特征 ， 付 出 的 代价 不 能 太 大 。 当 然 ， 这 还 要 
与 特征 的 分 闫 能 力 权 衡 和 考虑 。 


(2) 选取 的 特征 应 对 噪声 和 不 相关 转换 不 敏 
感 。 比 如 说 要 识别 车牌 亏 僻 ， 生 牌照 请 可 能 十 从 各 
TAHRIR, MEER LRE БУВР А 
的 内 容 ， 因 此 就 需要 得 到 对 几何 失真 变形 等 转换 不 
敏感 的 摘 给 于， 从 而 得 到 许 较 不 变 ， 或 是 投影 失真 
个 变 的 特征 。 


(3) 最 重要 的 一 点 ， 总 是 应 试图 寻找 最 具 区 
分 能 力 的 特征 。 


13.2 基本 统计 特征 


本 市 将 主要 介绍 一 些 第 用 的 基本 统计 特征 ， 包 
括 一 些 休 和 早 的 区 域 手 绘 子 ， 朋 方 图 及 其 统计 特征 ， 
以 及 灰 度 共 现 窍 阵 等 。 这 些 特征 具有 简单 、 实 用 的 
优势 ， 同 时 痛 完 学 习 它 们 将 有 助 于 读音 理解 统计 特 
征 的 特点 ， 从 而 更 好 地 把 握 本 半 后 面 的 内 容 。 


13.2.1 ІХ 122-7 k НМАТІГ.АВ 
实现 

在 经 过 图 像 分 割 得 到 各 种 感 兴 趣 的 区 域 之 后 ， 
可 以 利用 下 面 将 要 介绍 的 一 些 简 单 区 域 描绘 子 作为 
代表 该 区 域 的 特征 。 通 第 将 这 些 区 域 特征 组 合成 特 
全 问 量 以 供 分 类 使 用 。 

利用 的 侧 音 区域 摘 绘 子 如 下 。 


(1) 周 长 : Ко ЈЕЛЕ, BIMF K ERZ 
界 上 的 像 系 数目 。 


(2) 面积 : 区 域 中 的 像素 总 数 。 

(3) 致密 性 : 〈 周 长 )“/ 面 积 。 

(4) 区 域 的 质心 。 

(5) 灰 度 均值 : 区 域 中 所 有 像素 的 平均 值 。 


М (6) KEFE: 区 域 中 所 有 像 系 的 排序 中 


(7) 包含 区 域 的 最 小 矩形 . 


(8) 最 小 或 最 大 灰 肛 级 。 


(9) 大 于 或 小 于 均值 的 像素 数 。 


(10) 欧 拉 数 : 区 域 中 的 对 象 数 减 去 这 些 对 和 象 
的 孔洞 数 。 


在 MATLAB 中 ， 函 数 regionpropsO 是 用 于 计算 
区 域 摘 绘 子 的 有 利 工 具 ， 其 原型 如 下 。 


D = regionprops(L, properties); 


参数 说 明 : 


。 工 是 一 个 标记 算 阵 ， 可 通过 11.3.4 小 市 介绍 的 连 
通 区 标注 函数 bwlabel0 得 到 ; 

e properties 可 以 是 一 个 用 至 与 分 割 的 字 从 串 列 
表 ， 其 一 些 第 用 取 值 如 表 13.1 所 示 。 


表 13.1 properties 的 合法 取 值 表 


区 域内 的 像素 总 数 





көзө» ШОШ" 1х4]: [矩形 左上 角 x А, Жу 坐标 ，x Jln 
ТЕЛЕ, у JERS] 
区 域 的 质心 。 1x2 问 量 : [质心 x 坐标 ， 质心 y 坐标 ] 





ConvexHull ”| 包含 区 域 的 最 小 凸 多 边 形 。P хо: 每 一 行 包含 多 边 形 p 个 顶点 之 一 的 x 
Жу 坐标 


ао именни 








EulerNumber | 区域 中 的 对 象 数 减 去 这 些 对 象 的 孔洞 数 





j eÉ : 


° D 是 一 个 长 度 为 max( (DAAH, AA 
Н АВРАХ ЧАЛ, АЖ 


properties 1А = E ke lu lJ EKW, 


[01113.11 7 геріопргорѕ() р 2% Je HV faj АЧ 
区 域 特征 。 


如 要 提取 二 值 图 像 bw_mouth.bmp 中 每 个 区 域 
的 面积 和 质心 作为 特征 ， 相 应 代码 如 下 。 





>> І = imread('bw mouth.bmp'); % 谈 入 二 值 图 像 ， 文 件 bw_mout 
h.bmp 位 于 付 赠 光 盘 第 13 章 的 根 目 隶 中 

>> Il = bwlabel(I); % 标 注 连通 区 ， 得 到 标记 和 矩阵 I 

>> D = regionprops(Il, 'агеа', 'centroid'); % 提 取 面 积 和 
质心 

>> D % 但 看 返回 的 结构 体 


D = 
4х1 struct array with fields: 
Area 
Centroid 


>> D.Area % 4 个 连通 区 域 的 面积 
ans = 


ans = 

713 
ans = 

1 
ans = 
1 

>> v1 = [D.Area] % 将 面积 转 存 为 向 量 
v1 = 

92 713 1 1 
>> D.Centroid % 4 个 连通 区 域 的 质心 
ans = 

5.1304 31.4783 
ans = 

29.8597 21.6227 
апѕ = 

10 36 
апѕ = 

63 36 
>> v2 = [D.Centroid] % 将 质心 转 存 为 同 量 
V2 = 


5.1304 31.4783 29.8597 21.6227 10.0000 36. 
0000 63.0000 36.0000 


13.22 ”直方 图 及 其 统计 特征 


在 第 3 章 点 运算 中 ， 已 经 学 习 过 直方 网 的 概念 
和 计算 方法 ， 当 时 有 下方 图 更 多 的 是 作为 一 种 辅助 图 
像 分 析 的 工具 。 这 里 则 要 将 直方 图 作为 图 像 纹理 插 
述 的 一 种 有 力 手 段 ， 以 直方 图 及 其 统计 特征 作为 摘 
述 图 像 的 代表 性 特征 。 


首先 来 看 纹理 的 概念 。 纹 理 是 图 像 固有 的 特 
М, EKE WEERT A EWE) 在 空间 
以 一 定 的 形式 变换 而 产生 的 图 案 ( 模 式 ) ， 有 时 具 
有 一 定 的 周期 性 。 图 13.2 (d) —[ 132 (f) 给 出 
了 3 种 不 同 特点 的 纹理 : 金属 表面 的 平滑 纹理 、 包 
过 表面 的 粗糙 无 规则 纹理 ， 以 及 百叶 门 图 像 中 具有 
一 定 周期 性 的 纹理 。 既 然 纹 理 区 域 的 像 际 灰 度 级 分 
布 具 有 一 定 的 形式 ， 而 直方 图 正 是 描述 图 像 中 像素 
灰 撒 级 分 布 的 有 力 工具 ， 因 此 用 下 方 图 来 接 述 纹理 
ЖИЛ БМ ЕТ |] 


ZAE, HAWARA AHD] EL 27 9: m 
由 图 13.2 可 见 ，3 种 不 同 特点 的 纹理 对 应 看 3 种 个 同 
的 直方 图 。 这 膏 明 生 方 图 与 纹理 之 则 存在 看 一 定 的 
对 应 天 系 。 因 此 ， 可 以 用 直方 图 或 其 统计 特征 作为 
多 像 纹理 特征 。 下 方 独 本 身 融 是 一 个 同 量 ， 回 量 的 
维 数 十 且 方 图 统计 的 灰 度 级 数 ， 因 此 可 以 下 接 以 此 
器 量 作 为 代表 图 像 弘 理 的 样本 特征 癌 量 ， 从 而 交 给 
分 类 故人 处 理 ， 对 于 LBP 耳 方 图 就 第 第 这 样 处 理 ( 见 
13.577) 。 力 一 种 中路 是 进一步 从 年 方 图 中 所 取出 
能 够 很 好 地 描述 直方 图 的 统计 特征 ， 将 直方 图 的 这 
些 统 计 特 征 组 合成 为 样本 特征 同 量 ， 这 样 做 的 好 处 
征 大 大 降低 了 特征 同 量 的 维 数 。 








(d) sub texturel.bmp, 图 ta) 


(е) sub texture2.bmp, (b) (f) sub texturel.bmp, [ ic) 
中 人 纹理 区 域 的 放大 中 仇 理 区 域 的 放大 中 纹理 区 域 的 放大 
30 
25 
20 





50 100 150 200 


(h) 图 Ce) 的 直方 图 


(В) 图 (а) 的 直方 图 


(i) 图 (r> 的 直方 图 


413.2 ”3 种 不 同 特点 的 纹理 
直方 图 的 党 用 统计 特征 包括 以 下 几 种 。 
(1) 均值 一 一 纹理 平均 亮度 的 度量 。 


(13-1) 
其 中 , 工 是 灰 度 级 总 数 ， 五 表示 第 i NKE 


Ж, Р (zi) 是 归 一 化 直方 图 灰 度 级 分 布 中 灰 度 
为 zi М2, h (zi; ) 表示 有 直方 图 中 统计 的 灰 度 为 2 
的 像 系 个 数 〈 不 需要 归 一 化 ) 。 


1—1 


у (z — т) pi z) 


| 1 一 用 


(2) 标准 方差 一 一 纹理 平均 对 比 度 的 度量 。 





(13-2) 
ЖЕ, 5 ЕЈР БИНН УНИ ә 


一 般 地 ， 均 值 m 的 n ИРЕ ZJ: 


1 一 


L—1 
Е К ч L x _ и ң Г] I x Е s 
Jia ta == у (2; — т) рі z; ) 
| | 


(13-3) 
(3) 平滑 度 一 纹理 亮度 的 相对 平滑 度 度 

量 ， 对 于 灰 度 一 致 的 区 域 ， 平 滑 度 R 等 于 1， 对 于 
灰 度 级 的 值 有 着 较 大 差异 的 区 域 ，R 等 于 0。 


(13-4) 


(4) 210—8 J ЕЈ ш» XF 
ЯЙЖАН EL 27 , KAN: Ж МЕН, MEJ KH 
Жн: УРИА I| EL 77 Ч] 7Е Tail o 


L—1 


H3 = у (1 — Th] pz) 


(13-5) 


(5) 01—21 ВТ ААН ЗУ 
该 度量 最 大 并 由 此 处 开始 减 小 。 


(13-6) 


(6) Дй—— Б ЕЙЛТЕНУЛЁ нн» д K Н БИЛЛ, 
性 越 大 ， 信 息 量 也 丈 越 大 ;反之 确定 性 越 大 ， 己 经 
家 确 定 的 当然 信息 量 束 越 小 。 这 里 给 出 燃 的 定量 插 
№. 





1—1 
е 一 一 у p(z )logsp( z) 
1=0 


(13-7) 


例如 : НИВ. mE ЗР ЛЕН тт 
而 成 的 特征 同 量 如 : у= (т, о, В,е). 


应 认识 到 和 耻 方 图 及 其 统计 特征 十 一 种 区 分 能 
相对 较 蚤 的 特征 ， 主 要 古 由 于 直方 图 属于 一 阶 统计 
特征 ， 而 像 直 方 匈 、 均 信 这 样 的 一 阶 统 计 特 征 古 无 
法 反映 纹理 结构 的 变化 的 。 直 方 图 与 纹理 的 对 应 关 
系 并 不 是 一 对 一 的 : 自 完 ， 不 同 的 纹理 可 能 上 其 有 相 
同 或 相似 的 直方 图 ， 如 图 13.3 所 示 的 两 种 截然 不 同 
的 图 邓 束 共有 人 完全 相同 的 直方 图 ; KR, FH ADM 
个 不 同 的 直方 图 ， 也 可 能 其 有 相同 的 统计 特征 ， 如 
РИБ. PEZES. HE, аА ЛЕЧЕ 
来 作为 分 类 特征 需要 特别 注意 。 





图 13.3 FH] EL Јр Ж 


13.23 ЖЕЖ Е к H Visual C++ 实现 


KREN е Pa У ЕА Н 
ИГӘ Иш; П КРАЕ E a Ë ААЦ] хе НОН т 
同位 置 关 系 的 两 个 像 系 的 联合 分 布 ， 可 以 看 成 是 两 
ЛК УНИКЕ Н А, хе ТАТ. 


1. 理论 基础 


纹理 下 由 灰 度 分 布 在 空间 位 置 上 反复 区 蔡 变 化 
而 形成 的 ， 因 此 在 图 像 中 上 其 有 人 和 种 空间 位 置 天 系 的 
两 个 像 系 之 间 会 存在 一 定 的 灰 肛 关 系 ， 这 种 关系 被 
称 为 图 像 灰 度 的 空间 相关 特性 。 作 为 一 种 灰 度 的 联 
тте 
是 相关 性 。 


通常 用 Ps Жл КУУ Е, ИПЛЕ АЛ, 
， 则 Ps хі ВЕ, ЖНА 2628: Ps (i 
j) (i, j= 0,1,2,...,1, -1) 被 定义 为 共有 空间 位 置 关系 
6 =(D, , Ру) Н Жі 和 j 的 两 个 像 系 出 现 的 
次 数 或 概率 〈 归 一 化 ) ， 如 图 13.4 所 示 。 





4134 ”其 有 空间 位 置 天 系 6 且 灰 上 度 分 别 为 ;和 六 的 两 个 像素 


常用 的 空间 位 置 关系 6 有 水 平 、 竖 直 和 正 、 负 
45°? ， 共 4 种 ， 如 图 13.5 所 示 。 





D, ó = (0,+Dy) 





(a) 水平 (b) 坚 直 (с) +45° (d) —45° 


{13.5 ЖАРЕ Н H AR Z ul r 82 £ ó 


一 且 衬 间 位 置 天 系 6 确定 后 ， 束 可 以 生成 一 定 6 
下 的 灰 度 共 现 滤 阵 Ps ， 例 如 对 于 图 13.6 中 的 纹理 ， 
其 距离 为 1 的 水 平和 +459 Zk БЕЛЛЕ ЕП F PH2S o 


0 10 10 
P= Е 0 u 5 = (+1,0) 
010 о ,相应 地 归 一 化 形式 为 : 

O 1⁄6 1/6 

Р;= | 1/6 0 1/6 

1/6 1⁄6 0 


Ps = 





16 0 0 
О 16 Ü |.ó=(1. —lloró = [—1.1) 


0 0 18 , 相应 地 归 一 化 形 
式 为 : 





(а) 纹理 图 像 的 放大 显示 〔 每 方 格 1 像素 ) (b) 图 (а) 对 应 的 像素 灰 度 矩 隆 


413.6 ”图 像 littleTexture.bmp 的 纹理 像素 示意 图 


НВ Р s 总 共 含 有 L XL 个 元 素 ， 
HRERL 比较 大 时 它 将 是 一 个 庞大 的 方 阵 。 如 对 
于 一 般 的 256 灰 度 图 ，Ps 就 是 一 个 256x256 的 算 
阵 ， 共 219 个 元 素 。 如 此 庞大 的 矩阵 将 使 得 后 续 的 
计算 量 剧 增 。 因 此 普通 灰 度 图 像 通 间 要 经 过 处 理 以 
减少 灰 度 级 数 ， 而 后 再 计算 灰 度 共 现 算 阵 。 可 以 通 
过 分 析 纹 理 图 像 的 直方 图 ， 在 尽量 不 影 啊 纹理 质量 
аг HITE >4 J Zk ЕАР 2А EAK ERE a 

日 的 。 


2. Visual C++ 实现 


利用 Visual C++ 计算 灰 度 共 线 和 窍 阵 的 相关 代码 
HH F. 


Ал ы a FT TIT FE 


vector< vector<int> > CImgProcess::GetGrayMatrix(POINT 

ptD1, ш кз, 

参数 : 了 0р1: JK] tpl “= [aj y EL 2 £ BU251 74" sa 
OINT ptD2: KERM 2 [АЈ А ЖААШ 285 2" 54 

BEE: Ж 

ое 

/ / Т PL 2k J Е ВЕ 

vector< vector<int> > CImgProcess::GetGrayMatrix(POINT 

ptD1, POINT ptD2) 


{ 
vector< vector<int> > GrayMat; // KEJE kE 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 
int i, j; // 循 环 变 量 


int nGray; 


/ Т ЖЕ ы 
int nMaxGray = 0; 
for(i=0; i<nHeight; 1++) 
{ 
for(j=0; j<nWidth; j++) 
{ 
nGray = GetGray(j, i); 
if(nGray > nMaxGray) 
nMaxGray = nGray; 


} 
} 


// 初 始 化 灰 度 共 现 窍 阵 

vector<int> vecRow(nMaxGray+1, 0); 
for(i=0; i<nMaxGray+1; i++) 
GrayMat.push_back(vecRow); 


// 统 计 符 合 空间 位 置 关 系 并 分 别 具 有 像素 值 gray1，gray2 的 像素 
对 数目 
int grayl, gray2; 
int 12, j2; // 与 (i，j) 具 有 位 置 关系 ptD1 和 ptD2 的 点 
for(i=0; i<nHeight; i++) 
{ 
for(j=0; j<nWidth; j++) 


nGray = GetGray(j, i); 


i2 = i + ptD1.y; 

j2 = j + ptD1.x; 

if( ((i2>=0) && (i2<nHeight)) && ((j2>=0) &&(J2< 
nWidth)) ) 

l 


int nGrayD1 = GetGray(j2, i2); 
GrayMat[nGray][nGrayD1]++;// 相 应 计数 加 一 


l 

12 = i + ptD2.y; 

J2 = j + ptD2.x; 

if( ((i2>=0) && (i2<nHeight)) && ((J2>=0) &&(J2< 
nWidth)) ) 

l 


int nGrayD2 = GetGray(j2, i2); 
GrayMat[nGray][nGrayD21]++;// 相 应 计数 加 一 
J 
J 
J 


/ NB EIZIE JK kp EF 
return GrayMat; 


) 


利用 GetGrayMatrix(0) 孙 数 生 成 灰 度 共 现 矩阵 的 
完整 示例 被 封装 在 DIPDemo 工 程 的 视图 类 隐 数 void 
CDIPDemoView::OnFeaGraymatO0 中 。 以 能 够 表示 至 
ЇН) 6 的 两 个 点 的 坐标 为 参数 ， 调 用 岗 数 
GetGrayMatrix0O 即 可 得 到 输入 图 像 的 灰 度 共 现 窍 
阵 。 例 如 要 计算 +459 空间 位 置 关系 ， 代 码 如 下 。 


// 设 定 两 个 点 的 位 置 关 系 
POINT ptD1, ptD2; 


/ /+45 J jk E TEJ ko ВЕ 
1; 


+1; 


// 计 算 灰 度 共 现 窍 阵 
vector< vector<int> > GrayMat = imglnput.GetGrayMatrix( 
ptD1, ptD2 ) ; 





读者 可 以 通过 示例 程序 DIPDemo 中 的 六 蛙 命 
令 “ 特 征 提取 一 灰 度 共 现 矩阵 "来 观察 计算 结果 。 


同 获得 直方 图 特征 向 量 类 似 ， 可 以 直接 将 条 
ЖЕРЬ 的 按 行 或 按 列 存储 得 到 的 向 量 作为 特征 向 量 ， 
但 由 于 Ps 通常 较 大 ， 更 多 的 时 候 也 是 以 Ps 的 某 些 
重要 的 统计 特征 〈 如 二 阶 矩 、 对 比 度 和 焙 等 ) 组 合 
成 为 特征 向 量 。 


13.3 ”特征 降 维 


13.3.1 ”维度 灾难 


之 表 已 经 不 止 一 次 提 到 了 特征 同 量 的 维 数 过 噩 
会 增加 计算 的 复杂 度 ， 给 后 续 的 分 类 问题 带 来 负 
担 。 实 际 上 维 数 过 高 的 特征 问 量 对 于 分 类 性 能 ( 识 
别 率 ) 也 会 造成 负面 的 影响 。 直 观 上 通 篆 认为 样本 
器 量 的 维 数 越 员 ， 束 了 解 了 样本 更 多 方面 的 属性 ， 
掌握 了 更 多 的 情况 ， 应 该 对 提高 识别 率 有 利 。 然 
而 ， 事 实 却 并 非 如 此 。 


如 图 13.7 所 示 ， 对 于 已 知 的 样本 数目 ， 存 在 着 
一 个 特征 数目 的 最 大 值 ， 当 实际 使 用 的 特征 数目 超 
过 这 个 最 大 值 时 ， 分 类 器 的 性 能 不 是 得 到 改善 ， 而 
是 退化 。 这 种 现象 正 是 在 模式 识别 中 伞 称 为 “维护 
灾难 ”的 问题 的 一 种 表现 形式 。 例 如 ， 要 区 分 西瓜 
和 和 冬瓜， 表皮 的 纹理 和 长 客 比 例 都 是 很 好 的 特征 ， 
还 可 以 再 加 上 有 瓜 籽 的 颜色 以 辅助 判断 ， 然 而 继续 加 
入 重量 ， 体 积 等 特征 可 能 是 无 益 的 ， 甚 至 还 会 对 分 
类 造成 干扰 。 


413.7 ТАЕКЕ ПУ ЛЕН ТӘН. 


基于 以 上 所 述 的 原因 ， 降 维 就 对 操作 者 产生 了 
巨大 的 吸引 力 。 在 低 维 空间 中 计算 和 分 类 都 将 变 得 
人 简 蛙 很 多 ， 训 练 〈 教 授 分 类 如 如 何 区 分 不 同类 样本 
的 过 程 ， 评 见 第 14 章 ) 所 需 的 样本 数目 也 会 大 大 降 
低 。 通 过 选择 好 的 特征 ， 据 弃 坏 的 特征 〈13.3.2 小 
节 特 征 选 择 ) ， 将 有 助 于 分 类 需 性 能 的 提升 ;在 通 
过 组 合 特征 降 维 时 ， 在 绝 大 多 数 情况 下 ， 丢 春 某 些 
特征 所 损失 的 信息 通过 在 低 维 空间 中 更 加 精确 的 映 
奈 《13.3.3 小 车 特征 抽取 〉 可 以 得 到 补偿 。 


有 其 体 地 说 ， 降 低 维度 勾 存 在 看 两 种 方法 : 特征 
选择 和 特征 抽取 。 如 图 13.8 所 示 ， 特 征 选 择 是 指 选 
择 全 部 特征 的 一 个 子 集 作 为 特征 同 量 ;， 特征 抽取 十 
利通 过 已 有 特征 的 组 合 建立 一 个 新 的 特征 子 集 ， 
13.3.3 小 市 将 要 介绍 的 主 成 分 分 析 方 法 (Principal 


Component Analysis, РСА) ЕЛЕУ И ЕЛЕН) Z FE ZH 
合 建 立新 的 特征 子 集 的 一 种 特征 抽取 方法 。 


Х| 


Ж Хү 
х, Xi х, У х, 
特征 选择 | V 特征 抽取 | y 
шшш E 4 | у 
| М Ум 
Ху Xy XN 


图 13.8 ”特征 选择 和 特征 抽取 
13.3.2 ”特征 选择 简介 


对 于 每 一 个 访 尾 属 植 物 样本 ， 忆 共有 4 个 属性 
п] РИЯ Н —— С. ТЕЕ Е. SKREG 
т. Не р a E H ВАЕ [н] z HJ 
于 分 类 这 3 类 访 尾 属 植物 。 


下 面 的 MATLAB 程 序 选 择 了 不 同 的 特征 子 集 ， 
并 给 出 了 在 对 应 特征 空间 中 样本 分 布 的 可 视 化 表 
示 。 





>> load fisheriris % 载 入 Mat1lab 自 带 的 癌 尾 属 植物 数据 集 
>> data = [meas(:,1), meas(:,2)]; НЕКЛЕ ВЕ 
作为 特征 


>> figure 


>> scatter(data(1:50, 1), data(1:50, 2), 'b+') % 第 一 类 
hold on,scatter(data(51:100, 1), data(51:100, 2), 'r*') 
% 第 二 类 

hold on,scatter(data(101:150, 1), data(101:150, 2), 'go 


') % 第 三 类 

>> data = [meas(:,1), meas(:,3)]; НЕКЛЕ Р 
作为 特征 

>> figure 


>> scatter(data(1:50, 1), data(1:50, 2), 'b+') % 第 一 类 
hold on,scatter(data(51:100, 1), data(51:100, 2), 'r*') 


дуг — 


% 第 二 类 
hold on,scatter(data(101:150, 1), data(101:150, 2), 'go 
“y PER 


上 述 程序 的 运行 结 示 如 图 13.9 所 示 。 从 图 中 可 
见 选 择 不 同 的 特征 对 于 分 闫 的 影响 有 多 人 么 的 严重 。 
413.9 (а) P UAA” PARR HI RIEA TE S 
T 18] — HIEKE -AEAN y Е LAE, ХЕХ 
分 ; ПЕ [413.9 (b) P, ЖЖ Y EWK J ls H RK 
FENRIR F, АХАУ Z C 2 TRE 
由 此 可 得 出 结论 : TIRIS Fe JS А А Ea 
AWR H, ШЇ Se l ТЕЛЕН. ЕНУШЕ] 
наи 
JJ о 

















花 + ® 
y ï F 
4 k j 6 K 
度 ы S Q 度 
+ ++ e * © 
=, И ‚ +++ Б А Ф. + каж ‚+ 
у 4; + 
+ +, 
3 + = 
本 у +3 
ә ‚ бн ra ЖЕЕ 
4 45 5 55 6 65 7 75 8 4 45 5 55 6 65 7 75 8 
(a) 采用 花瓣 长 度 和 人 花瓣 宽度 作为 特征 (b) АЛЕНЕ H KREK RME 
413.9 ”3 类 不 同 的 访 尾 属 植物 的 150 个 样本 在 不 同 二 维特 征 空 


间 中 的 分 布 情况 
13.3.3” 主 成 分 分 析 


等 征 抽取 征 指 通过 已 有 特征 的 组 合 〈 变 换 ) E 
了 一 个 新 的 特征 子 集 。 在 众多 的 组 合 方法 当中 ， 线 
HAS EHA) 因 其 计算 催 单 且 便 于 解析 分 析 的 特 
反而 显得 碳 上 共 吸 引力 。 下 面 束 介绍 一 种 通过 特征 的 
线性 组 合 来 实现 降 维 的 方法 一 一 主 成 分 分 析 
(Principal Component Analysis, PCA) 。PCA 的 实 
质 束 是 在 尽 可 能 好 地 代表 原始 数据 的 前 提 下 ， 通 过 
и ај н ЖЕ АЗ к 5502 l| IK 28: 2 [н] 


1. 理论 基础 


主要 成 分 分 析 (PCA) 是 多 变量 分 析 中 最 老 的 
技术 之 一 ， 它 来 源 于 通信 理论 中 的 K-L 变 换 。1901 
年 由 Pearson 第 一 次 提出 主要 成 分 分 析 方 法 ， 直 到 
1963 年 Karhunan Loeve 对 谤 问题 有 的 归纳 经 历 了 多 次 
修改 。 

(1) 问题 摘 述 


对 于 qd 维 空间 中 的 n DIEDE ‚ғо, оғ, ® Ж 
如 何 能 在 低 维 空间 中 最 好 地 代表 它们 。 


(2) 理论 推导 
С) 0 维 时 的 情况 
首先 从 “ 零 ” 开 始 ， 即 考虑 在 0 维 空间 (一 个 
A) 中 ， 如 何以 一 个 qd 219] 8 о (d 2& 8] 9 R 
个 点 ) 来 表示 这 n 个 样本 ， 使 得 zo 到 这 n 个 样本 的 
距离 平方 和 Eg (z 0 ) 最 小 ， 其 中 : 
Es (Zo) = > || — =; || 


(13-8) 


以 ERRER, Вр", PU; 


П 

Eolzo) = D ДЕТ — т) — (2: — m) ||° 

П =. Ы П Т П a 
= x` |o — m|| — 2 5 ` (Za — m) (Z; — m) + > ` ||z; — т 

i=] i=] i=] 

n П n 
= У |z – m||2 — 2(za — т)" У (Z; — m) + У |6 — m||° 

:一 ] 1—1 1—1] 


П 


П T] ] П 
(т; 一 т.) = у Ti — n'm = у Ti 一 好 ， 一 у т; = Ü 
Р - | n < 
1 二] 1 二 ] 


e =] 一 


n п 
ө ө 1 二 1] =a 


(13-9) 


由 于 第 二 项 与 ?0 255, ш, Бо (ғо) ғо = 
时 取得 最 小 值 。 这 一 结论 表明 能 够 在 最 小 均 方 意义 
下 最 好 地 代表 原来 的 n 个 样本 的 d 维 癌 星 束 是 这 有 个 
样本 的 均值 。 换 言 之 ， 如 果 只 允许 以 q 维 空间 中 的 
一 个 反 作 为 q 维 空间 中 原始 n 个 样本 点 的 代表 ， 这 
个 点 吏 征 这 1 个 样本 扣 的 均值 。 


(2) 1 维 时 的 情况 


样本 均值 是 样本 数据 集 的 等 维 表 达 1 个 
к) 。 它 非 第 人 简单， 但 所 有 样本 在 等 维 的 空间 中 痢 
似 压 盎 到 了 同一 个 点 ， 因 此 无 法 反映 出 样本 之 间 的 
大 开 ， 也 束 无 法 进行 分 类 。 为 使 样本 具有 了 可 分 区 
性 ， 进 一 步 考 虑 一 维 (q 维 空间 中 的 1 条 直线 ) 的 情 


m, ЕУ PFE KI B p EE ADJ IB: BU12 ELZE IM 
EHK. ВЕУ АЕА ERA. Фе 表 
71 BID HJ ЕҤ Ж%Ҥ) Pa r Ут] ж, MARA 
程 可 表示 为 : 


T = т + ae 


Я, ат, AF8 PL 2k КЖ 
点 离开 点 m 的 距离 。 


如 图 13.10 所 示 ， 以 样本 z i EARE WERI 
ха ; 作为 = ; 的 一 维 表 达 ， {ЕН = 21), Ея (1) 
示 古 在 1 维 空间 中 的 表示 。 П +a 可 以 看 作 征 在 
一 维 空间 (下 线 z ) 中 对 zi НИД, НАКА н] 
АП: 


q; = |Z; — т : cos(8; ) 
(13-10) 


H To nEn- т јаје WA, На=1, 
故 上 式 可 表示 为 : 


a; = |Z; — |- |El- cos(0;) = Z. (z; — m) = (a) (z; — m) 
(13-11) 
ЖЕН, (07 表示 s Н В 





m 
@ 
а; 
@ 
Xj 
@ 
м ` 

` @ 
„М. © 
X; ` 


413.10 ”样本 的 一 维 表 达 


天 键 的 问题 吏 征 如 何 硝 定 百 线 z 的 最 优 方 回 以 
使 得 平方 误 兰 PE1(G) 最 小 。 下 面 给 出 推导 过 程 。 


n n 
Eile) = r umn + dEl 一 т}; ||° 一 y ` [же — (Ti 一 т) 
i=l 1 二 ] 


° Ё -m 天 | 
= i=] = 


将 式 〈13-11) 代入 ， 得 : 
AOIR -25o + Dll 


1—1 
П П 
а у Ше 
¿—1 є—] 


П n 
= 一》 (EE —m)) + Y lz; т 
i=] 


¿=1 


П 于 


一 = у shun т; 一 MT — m) + Y ` |T; — m||? 


1—1 l 


= 一 人 э т, — mz — m) )e ув — m||” 


П 
= 262+ у ||: – т)? 
1—1 


(13-12) 


其 中 ，d xd 和 矩阵 ” - е И С 
Е СРИ Matrix) 。 


MEE EERDER, ВЛЕ 5 ЗЕК Ее 
МЕЖ ЭЕ ЖЕГЕ Уп -1 o 


ÆA (13-12) F, 205г Дд, WA, Ж 


想 让 E 1 (z ) 最 小 ， 就 要 使 第 一 个 负 号 项 = 1 S: 最 
Ko el S; 的 最 大 化 是 一 个 带 有 约束 条 件 的 优化 问 
题 ， 可 以 采用 在 高 等 数学 中 的 拉 格 朗 日 乘 数 法 求 

解 ， 约 束 条 件 为 |: |=1。 


Фу = l Sz -a (e 1 -1)， 其 中 ;为 拉 格 朗 日 乘 数 ， 
过 对 a RREH н 740, 49: 


= = 25 — HE = 0 = SE = А 
(13-13) 


к (13-13) ТЕ 9 1] {ЖЕ ЕУ) 
И (9+5=0, Ур 5 为 对 称 阵 ， 故 有 : 


DET SE 
є" 








— 2 ç 
(13-14) 


式 (13-13) 中 5 为 一 个 q Ër y , z 是 一 个 d 维 
可 量 ， 入 为 一 个 实数 。 显 然 ， 这 是 线性 代数 中 本 征 
方程 的 典型 形式 ， 和 是 本 征 值 ， 而 = 是 散布 矩阵 S 的 
本 征 向 量 。 对 式 〈13-13) 稍 加 变形 ， 两 边 同 时 左 
је 1, 得 : 


ЕТЕ = ХАТЕ A 


(13-15) 


至 此 ， 可 以 很 自然 地 得 出 结论 : 为 了 最 大 化 = 1 
Sz, MZR AERES 的 最 大 本 征 值 所 对 应 的 本 
征 问 量 作为 投影 直线 = НО [а] х, НУУ 
全 部 n 个 样本 z 1 ,z 2 ,.….,zn 以 散布 矩阵 最 大 本 征 值 对 
应 的 本 征 癌 量 为 方 回 的 直线 投影 ， 可 以 得 到 最 小 平 
JIR EAX Кп 个 样本 有 的 一 维 表示 a ToU D; ¿Gn о 
从 本 质 上 来 说 ， 这 个 投影 变换 实际 上 融 征 基 的 转 
换 。 在 原来 的 qd 维 空间 中 ，d 个 其 分别 是 每 个 坐标 
轴 方 向 的 单位 矢量 z ; (i =1,2,...,n )， 空 间 中 的 某 个 样 
<; j =(z ilxZij2,...Z id ) 可 以 由 这 组 基 表 示 为 : 


(13-16) 


投影 至 直线 = 之 后 ， 在 新 的 一 维 空间 中 (一 条 
HR) ， 单 位 矢量 = 成 为 了 唯一 的 1 个 基 ， 那 么 在 这 
个 一 维 空 间 中 的 某 个 样本 z ;' 同 样 可 以 由 这 个 基 问 量 
z RIRN: 


A — = s 
T; = M + tt 


(13-17) 


此 时 = ; "就 是 原始 样本 z ; 经 过 投影 变换 降 维 后 的 
一 维 搞 述 。 注 意 到 在 原来 的 qd 维 空间 中 ， 和 是 以 菏 个 
样本 = ; 的 基 展 开 式 〈 式 〈13-16) ) 中 基 的 系数 来 表 
示 此 样本 : = E Т5 | Эжеш 10 ) о 同样 在 一 维 空 间 
中 以 基 : 的 系数 将 它 表 示 为 一 维 向 量 z ; (1) =( ai )。 


(3) 推广 至 d ' 维 
上 述 的 结论 可 以 了 立刻 从 一 维 空间 (下 线 ) 的 投 
影 推广 至 qd ' 维 空间 (d'<d ) 的 投影 。 将 式 (13- 
17) 重 与 为 : 
т = т + 2. ARER 
(13-18) 


a HJ PIA TRZE ME И РЁ Ж: 


Eg (El, 2, ..., € = Э lun + У z) 一 五 | 
容易 证 明 五 ) ТЕ [в] а 1? #2. .ed АВ 
MERES 的 前 qd ' 个 (从 大 到 小 〉 本 征 值 所 对 应 的 本 
征 回 量 时 取得 最 小 但 。 因 为 散布 算 阵 $ 为 实 对 称 矩 
阵 ， 因 此 这 些 本 征 同 量 都 是 彼此 正 交 的 。 这 些 本 征 


Шс 1 гэ, ao са 就 构成 了 在 低 维 空间 中 (4 
Ж) 中 的 一 组 基 同 量 ， 任 何 一 个 属于 此 q ' 维 空间 的 
回 量 = ; ' 均 可 由 这 组 基 表 示 : 


т; = m + > RER 
(13-19) 
H 中 ‚ (Lk = Ek» (т; 一 т) = Ep (Ж; 一 m) 
(13-20) 
zÑ (13-19) "ЈУ Гаа... ЈА 38 
ail diz pe ан ее Component), d 
ДЕГЕЛ -le o) ПЖ Же | ТЕ ЕН 28 [n] Ж 


аа 所 张 成 的 d ЯЕ x 间 中 的 低 维 表示 ， 而 z ; ' 实 
际 上 是 对 原样 本 zi 的 一 种 近似 ， 且 近似 的 程度 随 

Жа ' 的 增 大 而 增加 ， 这 一 过 程 可 以 看 作 是 对 原样 本 
5 的 重建 。 EXIDE, WI (13-20) ЖУЙ 
影 计算 系数 qj td 而 将 式 (13-19) 
在 变换 空间 中 计算 zj; 的 过 程 称 为 重 构 。 


注意 到 上 面 这 些 内 容 和 傅立叶 变换 中 的 分 解 
(傅立叶 变换 ) 5E RRE) 十 分 相 
似 ， 只 是 傅立叶 变换 中 的 基 是 sin0 和 cos0 形 式 的 基 


KAO IWJ ВЈ еа (HÆ) „ А МАК 
质 上 来 说 都 是 一 种 基 或 者 说 是 坐标 系 的 变换 ， 分 解 
АЙЕ е ЖЕ} ААН {ўа БИРА 906 ЗИТ ЖЕ 《坐标 
R) F, ПЛЕЙ ЛЕЛИ ЫТ ERR ER АН Җ 
Ji EK РАХ. 


2. 几何 解释 


从 多 元 统计 分 析 的 角 肛 来 看 ， 梓 本 #1 ,#2 ,...,z 
在 原 d 维 空间 中 形成 了 一 个 qd 维 椭 球形 状 的 云 团 ， 
而 散布 滤 阵 的 本 征 癌 量 就 是 这 个 椭 球 的 主轴 ， 如 图 
13.11 所 和 示 。PCA 实 际 上 是 寻找 云 团 散布 最 大 的 那些 
主轴 方 同 ， 通 过 辐 这 些 方 同 同 量 所 张 成 的 空间 的 投 
影 达 到 了 对 特征 空间 降 维 的 目的 。 同 时 ， 从 图 13.11 
中 不 难 及 现 ，PCA 投 影 转换 举 标 系 〈 从 原来 的 m -这 
坐标 系 转换 为 a -所 坐标 系 ) 的 过 程 实际 上 也 是 去 除 
数据 线性 相关 性 的 过 程 ， 这 一 点 在 本 节 最 后 关于 
ORL 人 脸 数 据 集 的 PCA 降 维 处 理 的 实例 中 还 将 结合 
实验 结果 做 进一步 的 说 明 。 


CS 





413.11 2 维 空间 中 的 样本 桶 球 云 团 及 其 2 个 主轴 
3. PCA 计 算 
在 前 面 略 显 顶 烛 的 理论 知识 之 后 ， 来 看 一 个 
PCA 计 算 的 实例 ， 旨 在 帮助 读者 巩固 之 前 的 PCA 理 
论 并 掌握 PCA 计 算 的 要 点 。 


【 例 13.2】 主 成 分 计算 。 


计算 下 面 两 维 数据 集合 的 主要 成 分 分 量 ， 并 利 
用 PCA 方 法 将 数据 降 至 1 维和 2 维 。 然 后 尝试 利用 1 
个 和 2 个 主 成 分 实现 对 第 一 个 样本 的 重 构 。 
X = 1(1,2),(8,3),(3,5),(5,4),(5,6),(6,5),(8,7),(9,8); 
(1) 计算 散布 矩阵 S 的 本 征 同 量 


自 先 计算 散布 矩阵 5 СЕЕ Е Е, n 
-1 伴 的 系数 不 会 影响 本 征 问 量 的 计算 ) 。 


样本 均值 : я = (5, 5) 


8 н А 
| | е РЕБ т 6.25 4.25 
ie == у 11 — "0 — т) = ДЕ е 

4.25 3.5 


i=] 


接 下 来 ， 解 式 〈13-13) 中 的 本 征 方程 。 
88= л = |8 МЕ=0, EAI 2х2 Ва Ау [Е 


0.25 А 4.25 
4259 939-2 


展开 上 式 左 侧 的 行列 式 ， 最 终 解 得 。 


À = 9.34, Ау = 0.41 


ВНА р о TIRAR (13-13) ， 解 得 : z1 


=i = Ü 








= (0.81,0.59) Í, ¿,)= (-0.59,0.81) 1. їг 1 和 
是 彼此 正 交 的 单位 同 量 ， 如 网 13.12 所 示 。 


8 10 


6 


4 


| S E S 
‚||| 
паалан 
DD OA CE 
_|М | 
awia 
_| |, 
SITI 
_ ү 





||| ||| 
sss 
э үү. 
О 2 +. 6 б 10 


1 
413.12 ”样本 分 布 及 其 主轴 方 回 
(2) 降 至 1 维 


通过 将 8 个 样本 同 其 主轴 z 1 投影， 可 以 得 到 这 有 8 
个 样本 后 的 1 维 表示 。 


根据 公式 : aa (9 his, 49: 


п11 = —5.Ü 1.431 = —2.8, азу = — 1.62. aq = —0.59, аз = 0.59. ав = Ü.81. 
271 = 3.61. ав = 5.01 


(3) [6222 


RM, PI] Ее ә 投影 ， 根 据 
аз = (9: m). i= 1.2.....8 可 得 : 


qy = 0.07. a» = —Ü. 44. аз = 1.18. ay = 0.81. aş = 0.81. ав = —0.59. 
пто = —Ü. 15, as = 0.07 
k. 5.01, —0.07), 2” = (—2.8, м0) 2) (1.62. 1.18), 242 = (一 0.59 0.81). 


2) L 00.59, 0.81), z) = (0.81, —0.59),. 


(4) ЖМ] 


= (3.61, 0.15), z% = (5.01,0.07) 


如 来 仅 利 用 第 1 个 主 成 分 分 量 实 现 对 样本 z 1 的 
ШЇ (Еҥ), W: 


—{ 


m =т+аце= (0.9419, 2.0441) 


近似 程度 可 以 用 zj;' 与 原样 本 5 HJ [КИН А Ж 


dist? = [| — 211 = y (1 — 0.9419)? + (2 — 2.0441)? = 0.0729 


利用 2 个 主 成 分 分 量 实现 对 样本 z 1 的 近似 ( 重 
№), S: 


ЕУ. шш 


ст (0.9832,1.9874) 
而 41512) = |81 — т\|| = 0.021 


注意 到 dist 2) <аіѕ ©, ， 这 和 之 前 给 出 的 近似 程 
度 随 着 主 成 分 分 量 数目 增 大 而 增加 的 结论 是 一 臻 
的 。 


4. 数据 表示 与 数据 分 关 


通过 PCA 降 维 后 的 数据 并 不 一 定 是 最 有 利于 分 
类 的 ， 因 为 PCA 的 目的 是 在 低 维 空间 中 尽 可 能 好 地 
表示 原 数 据 ， 确 切 地 说 是 在 最 小 均 方 天 意义 下 最 能 
代表 原始 数据 。 而 这 一 上 日 的 有 时 会 和 数据 分 类 的 初 
点 相 违背 。 图 13.13 说 明了 这 种 情况 ，PCA 投 有 影 后 数 
据 样 本 得 到 了 最 小 均 方 意义 下 的 最 好 保留 ， 但 在 降 
维 后 的 一 维 宇 间 中 两 类 样本 弯 得 非常 难以 区 分 。 儿 


中 还 给 出 了 一 种 适合 于 分 类 的 投影 方案 ， 对 应 看 为 
一 种 常用 的 降 维 方法 一 一 线性 判别 分 析 (Linear 
Discriminant Analysis, LDA) „ PCA FR HI ВЕ 
有 效 表 示 数 据 的 主轴 方 回 ， 而 LDA 则 是 寻找 用 来 有 


效 分 类 的 投影 方 问 。 





特征 1 


413.13 ”分别 以 信号 表示 和 分 类 为 目的 的 降 维 


5. PCA 的 MATLAB 实 现 


РА #ргіпсотр()5 1 Y ЈРСАНЈ] 5, Ж ЛІ, 


调用 形式 如 下 。 
[COEFF, SCORE,latent] = princomp(X); 
参数 说 明 : 


° X 为 原始 样本 组 成 n xd ЕВЕ, В 
个 样本 特征 癌 量 ， 每 一 列表 示 样 本 特征 同 量 的 


一 维 。 如 对 于 例 13.2 中 的 问题 ，X 束 是 一 个 8x2 
的 样本 窍 阵 ， 总 共 8 个 样本 ， 每 个 样本 2 维 。 


返回 值 : 


COEFF: 主 成 分 分 量 ， 即 变换 空间 中 的 那些 基 
а] 82.0.0606, ШЕКИ Е ВЕНУ АКЕ а] 
量 ; 

SCORE: EWT, X 的 低 维 表示 ， 即 X 中 的 数 
据 在 主 成 分 分 量 上 的 投影 《可 根据 需要 取 前 面 
几 列 的 ) ， 也 束 是 前 文摘 述 中 的 系数 mao .a 


latent ， 一 个 包含 着 样本 协 方差 矩阵 本 征 值 的 向 


作为 一 个 调用 实例 ， 利 用 princomp(0 〇 函数 来 里 
新 完成 例 13.2， 相 应 代码 如 下 。 





>> X = [1,2;3,3;3,5;5,4;5,6;6,5;8,7;9,8] % FIERE, 

1 МАЊА ЕЈ 5 

X = 
1 2 
3 3 
3 5 
5 4 
5 6 
6 5 
8 7 
9 8 


>> [COEFF, SCORE, latent] = princomp(X); % 主 成 分 分 析 
>> COEFF % +5ў?7?7 ж FINNER [aj Э [н] ш) 
COEFF = 

0.8086 -0.5883 

0.5883 0.8086 


>> SCORE % 主 成 分 ，SCORE(:，1) 为 X 的 一 维 表示 ，SCORE 为 X 在 变 

换 空 间 中 的 二 维 表 示 

SCORE = 
-4.9995 -0.0728 
-2.7939 -0.4407 
-1.6173 1.1766 
-0.5883 -0.8086 
0.5883 0.8086 
0.8086 -0.5883 
3.6025 -0.1476 
4.9995 0.0728 


>> latent % XF: KI) = MEIHE 
latent = 

10.6764 

0.4664 


13.3.4 快速 PCA 及 其 实现 


PCA 的 计算 中 最 主要 的 工作 量 是 计算 样本 协 方 
于 窍 阵 的 本 征 值 和 本 征 问 量 。 设 样本 和 窍 阵 X 大 小 
为 n ха (n "d 维 样本 特征 同 量 ) ， 则 样本 散布 矩 
Е СИНВЕ) 5 将 是 一 个 d xd 的 方 阵 ， 故 当 维 
жа 较 大 时 计算 复杂 上 度 会 非常 局。 例如 当 维 数 dq 
=10000, S 是 一 个 10000x10000 的 和 矩阵， 此 时 如 果 


采用 上 和 面 的 princomp() 函 数 计算 主 成 分 MATLAB 
通 币 会 出 现 内 存 耗 尽 的 错误 ， 即 使 有 足够 多 的 内 
я 要 得 到 S 的 全 部 本 征 值 可 能 也 要 花费 数 小 时 的 
HT [Н], 


1. 理论 基础 


幸运 得 是 ， 对 于 这 样 的 问题 并 非 束 手 无 策 。 有 
一 个 非常 好 的 PCA 加 速 技巧 可 以 用 来 计算 矩阵 5 JE 
零 本 征 值 所 对 应 的 本 征 同 量 。 设 Z xa IERE REX 
中 的 每 个 样本 减 去 样本 均值 后 得 到 的 矩阵 ， 则 航 
HERES 为 (ZL Z)a xg。 现 在 考虑 和 矩阵 R =(ZZ! ) „хп 
， 一 般 情 况 下 由 于 样本 数目 n 远 远 小 于 样本 维 数 q 
‚ 的 尺寸 也 远 远 小 于 和 散布 距 阵 5 ， 然 而 ， 它 与 5 
有 看 相同 的 非 和 零 本 征 值 。 


wn 维 列 同 量 s 是 R 的 本 征 回 量 ， 则 有 : 
(ZZ!) А 


(13-21) 


式 (13-21) 两 边 同时 左 乘 Z+ ， 并 应 用 和 矩阵 乘 
法 的 结合 律 得 : 


(Z1zY(ZT) = MZT1) 


(13-22) 


20 (13-22) 说 明 zrz 为 散布 矩阵 S$ =(Z t 2 )g xg 
的 特征 值 。 这 说 明 可 以 计算 小 矩阵 R=(ZZ 1) nxn 的 
本 征 向 量 s ， 而 后 通过 左 乘 Z 1 得 到 散布 矩阵 S$ =(Z ! 
)аха 的 本 征 向 量 Z 1 


2. MATLAB 实 现 


本 节 编 写 了 fastPCAO 叉 数 用 来 对 样本 窍 阵 A Ж 
行 快 速 主 成 分 分 机 和 降 维 《〈 降 至 K 维 ) ， 其 输出 
pcaA 为 降 维 后 的 K 维 样本 特征 回 量 组 成 的 算 阵 ， 
行 一 个 样本 ， 列 数 k 为 降 维 后 的 样本 特征 维 数 ， 相 
当 于 princompO 范 数 中 的 输出 SCORE， 而 输出 V 为 
主 成 分 分 量 ， 妈 princomp0 〇 函数 中 的 输出 COEFF 。 


fastPCAO 函 数 的 实现 代码 如 下 。 





function [pcaA V] = fastPCA( А, k ) 


% 
% 输入 : А --- 样本 窍 阵 ， 每 行为 一 个 样本 
% k --- KREE k 维 

% 

% 输出 : pcaA --- 降 维 后 的 к 维 样本 特征 向 量 组 成 的 矩阵 ， 每 行 
一 个 样本 ， 列 数 k 为 降 维 后 的 样本 特征 维 数 

% V --- 主 成 分 器 量 


[r c] = size(A); 


% 样本 均值 


meanVec = mean(A); 


% 计算 协 方差 矩阵 的 较 置 covMatT 
Z = (A-repmat(meanVec, г, 1)); 
covMatT = Z * Z'; 


% 计算 covMatT 的 前 k 个 本 征 值 和 本 征 辣 量 
[V D] = eigs(covMatT, k); 


% 得 到 协 方差 窍 阵 (covMatT) ”的 本 征 回 量 

уе Z ү: 

% 本 征 同 量 归 一 化 为 单位 本 征 同 量 

for 1=1:К 
V(:,i)=V(:,i)/norm(V(:,i1)); 

end 


% 线性 变换 《投影 ) REE k 维 
рсад = Z * V; 


% REMER V 和 变换 原点 meanVec 
save( 'Mat/PCA.mat', 'V', 'meanVec'); 


fastPCAO 的 实现 中 调用 了 MATLAB 库 函数 
eigs() 来 计算 矩阵 R =(271) xn 的 前 K 个 本 征 向 量 ， 
即 对 应 于 最 大 的 K 个 本 征 值 的 本 征 回 量 ， 其 调用 形 
式 如 下 。 


ти, р | 


] = eigs(R 


‚ Ё 





参数 说 明 : 


° R 为 要 计算 的 本 征 值 和 本 征 问 量 的 矩阵 ; 
e k 为 要 计算 的 本 征 同 量 数目 。 


返回 值 : 


。 输 出 矩阵 V, x x 的 每 列 对 应 1 个 本 征 向 量 ，K 个 本 
征 向 量 从 左 到 右 排 列 ; 

o НЕР, x x 对 角 线 上 的 每 个 元 素 对 应 一 个 本 
ДЕЛЕ. - 


在 得 到 包含 R WAME жЕ ЖУ 之后， 为 计 
ВСЕ 5 的 本 征 同 量 ， 只 需 计 算 ZTVd xk 。 此 
外 ， 还 应 注意 PCA 中 需要 的 是 上 共有 单位 长 度 的 本 征 
问 量 ， 改 最 后 归 除 以 访问 量 的 使 从 而 将 正 交 本 征 回 
量 归 一 化 为 单位 正 区 本 征 癌 量 。 


这 里 建议 旋 首 找 一 个 维 效 较 高 的 数据 集 ， 分 别 


利用 princomp0O0 和 fastPCA0O 进 行 PCA 计 算 并 比较 它 
们 的 效 诸 。 在 下 一 节 天 于 人 腔 特 征 抽取 的 高 级 应 用 
实例 中 ， 将 使 用 fastPCAO 对 超过 10000 维 的 人 脸 样 
ЖЖ ВНУ ЕКА o 


134 ”综合 案例 一 一 基于 PCA 的 人 
今 特 征 抽取 


本 下 将 应 用 PCA 拉 术 来 抽取 人 脸 特 征 。 一 幅 人 
OR IEIÈ H ERZ HARR, WRAS MRR 
作为 1 维特 征 ， 将 得 到 一 个 维 数 非常 局 的 特征 问 
量 ， 计 算 将 十 分 困难 ， 而 且 这 些 像 系 乙 间 通 帅 征 共 
有 相关 性 的 。 这 样 ， 利 用 PCA 技 术 在 降低 维 数 的 同 
Е ЕЕ ЕРА АЕ Е [АЈ ЈАНО А 
然 成 为 了 一 个 比较 理想 的 方案 。 


下 和 面 介绍 这 个 应 用 案例 的 实现 及 其 相关 问题 。 
本 节 后 面 将 出 现 的 MATLAB 实 现代 码 都 被 封装 在 
PCA_ORL 工 具 箱 中 ， 旋 者 可 在 随 书 附 赠 光 盘 第 13 
章 的 “code” 文 件 严 中 找到 。 


13.4.1 ”数据 集 人 简介 


ERIH AGERER H E A MORL A H JE 
[6]. 26х71 ЛАВЕ F Taj PL. Jr Zf 


(1) ORL 数 据 库 共 有 400 幅 人 脸 图 像 (40 人 ， 
每 人 10 幅 ， 大 小 为 112x92 像 素 ) 。 


(2) 这 个 数据 库 比较 规范 ， 大 多 数 图 像 的 区 
照 方 加 和 强度 部 大 个 多 。 


(3) BADIRE 2A. MWNE, R 
EXN IDERE, KEZE EA. 


(4) 并 不 是 每 个 人 都 有 所 有 的 这 些 变 化 的 图 
像 ， 即 有 些 人 姿势 变化 多 一 氮 ， 有 些 人 表情 变化 多 
一 把， 有 些 还 戴 有 眼镜， 但 这 些 变 化 部 并 不 大 。 


ORL 人 上 脸 库 中 第 1 个 人 的 一 些 人 上 脸 图 像 如 图 
13.14 所 示 。 





БОЗ 


413.14 ” ORL 中 第 1 个 人 的 8 幅 人 脸 图 厂 


下 是 基于 ORL 人 上 脸 库 图 像 在 光照 ， 以 及 关键 点 
如 眼睛 、 哮 巴 的 位 置 等 方面 比较 规范 的 特点 ， 实 验 
可 以 在 该 图 片 集 上 直接 展开 ， 而 不 是 必须 要 进行 归 
上 七 和 校准 等 工作 。 读 者 可 以 
上 下 载 ORL 人 脸 数 据 库 。 这 里 选用 每 个 人 的 前 5 张 
= 这 样 40 个 人 共 200 幅 样本 


13.4.2 ”生成 样本 和 矩阵 
首先 要 做 的 是 将 这 200 幅 人 脸 图 像 转 换 为 癌 量 


E ЗЕН РКЕ ЕЕ. р ВеааҒасеѕ() Н Т > 
成 这 一 任务 。 


ReadFaces0O 依 次 谈 入 样本 疼 像 〈 假 定 40 个 人 的 
样本 图 像 位 于 “Data/ORL/” 路 径 下 ， 如 第 18 个 人 的 
10 幅 图 像 位 于 “Data/ORL/S18” 中 ) ， 然 后 将 112x92 
的 图 像 按 列 存储 为 一 个 10304 维 的 行 向 量 作为 样本 
Ж Е ЕасеСопќаіпег А) “А (17) , а 
МЕД Е Маг H>< T Ј“ЕасеМағ тағ X4} 
rR. РАДУ АКЗЕР F 


function [ітеКом, ітеСо1, ҒасеСопЁаіпег, ҒасеГабе1 |=Кеааға 
ces(nFacesPerPerson,nPerson, bTest) 


% 谈 入 ORL 人 脸 库 的 指定 数目 的 人 脸 前 前 五 张 (训练 ) 
输入 : nFacesPerPerson --- 每 个 人 需要 谈 入 的 样本 数 ， 默 认 人 


nPerson --- 需要 谈 入 的 人 数 ， 默 认为 全 部 40 个 人 
bTest --- bool 型 的 参数 。 默 认为 0，， 表 示 读 入 训练 样本 ( 
05%) ; 如 果 为 1， 表 示 斌 入 测试 样本 (后 5 张 ) 

% 
% 输出 : FaceContainer --- HÆKKAR, nPerson * 10304 
的 2 WERE, УХТ А ЛА 


5< < ук 88 < 
л 


if nargin==0 %default value 
nFacesPerPerson=5;% 前 5 张 用 于 训练 
nPerson=40;% 要 读 入 的 人 数 ( 每 人 共 16 张 ， 前 5 张 用 于 训练 ) 


bTest = ð; 
elseif nargin < 3 
bTest = 0; 


end 


img=imread('Data/ORL/S1/1.pgm' ) ;% 为 计算 尺寸 先 读 入 一 张 
[imgRow,imgCol]=size(img); 


FaceContainer = zeros(nFacesPerPerson*nPerson, imgRow*i 
mgCol); 
faceLabel = ғ2егоѕ(пЕасеѕРегРегѕоп*пРегѕоп, 1); 


% 读 入 训练 数据 
for 1=1:пРегѕоп 
il=mod(i,10); % 个 位 
10=сһаг(1/10); 
strPath='Data/ORL/S '; 
if( i@—=90 ) 
strPath=strcat(strPath,'@'+i@0); 
end 
strPath=strcat(strPath,'@0'+il); 
strPath=strcat(strPath,'/'); 
tempStrPath=strPath; 
for j=1:nFacesPerPerson 
strPath=tempStrPath; 


if bTest == 0 % 读 入 训练 数据 
strPath = strcat(strPath, '@'+j); 


else 
strPath = strcat(strPath, num2str(5+j)); 


end 


strPath=strcat(strPath,'.pgm'); 
img=imread(strPath); 


HIE EE A KI BRIZI ENIT AEA EAR ав асес 
ontainer 的 对 应 行 中 

FaceContainer((i-1)*nFacesPerPerson+j, :) = img( 
:)'; 


faceLabel((i-1)*nFacesPerPerson+j) = i; 


end % 7 
епа % 1 


% 保存 人 脸 样 本 矩阵 


save( 'Mat/FaceMat.mat', 'FaceContainer') 





13.4.3” 主 成 分 分 析 


经 过 上 和 耐 的 处 理 ， 窍 阵 FaceContainter 每 一 行 就 
成 了 一 个 代表 采 个 人 脸 梓 本 的 特征 回 量 。 通 过 主 成 
分 分 析 的 方法 可 将 这 些 10304 维 的 样本 特征 向 量 降 
至 20 维 。 这 样 数 据 集中 每 个 人 上 脸 样 本 都 可 以 由 一 个 
20 维 的 特征 同 量 来 表示 ， 以 作为 后 续 分 类 所 灯 用 的 
特征 。 在 本 书 的 第 16 章 中 ， 我 们 将 在 本 节 工 作 的 基 
础 上 采用 支持 向 量 机 (SVM) 对 这 些 20 维 的 人 脸 样 
本 进行 分 类 ， 从 而 实现 一 个 商 单 的 人 脸 识 别 系 统 。 


本 将 对 样本 窍 阵 FaceContainer 进 行 主 成 分 分 
析 的 整个 过 程 封 竣 在 下 面 的 main0 国 数 中 ， 其 参数 
是 主 分 量 的 数目 ， 即 降 维 至 K 维 。 议 函数 首先 调用 
ReadFaces0 4 19 2] / ЛЛУ ЖЕ EE 
ЕасеСопѓаіпег, m № A] H 13.3.4717 F ЕЈ а5їРСА() 
IAT ЕДЕ ВЕНЧИКА 71 омрітЕасеѕ#1 + 
成 分 分 量 矩 阵 W ， 并 将 LowDimFaces 保 存 至 Mat 目 
孙 下 的 “LowDimFEaces.mat” 文 件 中 。 相 天 人 代码 如 
下 。 


function main(k) 

% ORL 人 上 脸 数据 集 的 主 成 分 分 析 
X 

% 输入 : k --- е k Ж 


% 定义 图 像 高 、 宽 的 全 局 变量 imgRow 和 ітеСо1, ЕЛЕ ReadFa 
ces 中 被 赋值 

global imgRow; 

global imgCol; 


% 读 入 每 个 人 的 前 5 副 图 像 

nPerson=40; 

nFacesPerPerson = 5; 

01ѕр1ау(' ЛА AJ523398... ); 
[imgRow,imgCol,FaceContainer,faceLabel]=ReadFaces(nFace 
sPerPerson,nPerson); 


四 Ў 


пЕасеѕ=5іғе(ЕасеСопёаіпег, 1); «#2 (ЛЛ) 数目 
display('PCA 降 维 ...'); 

% ІомрітҒасеѕх=200*20 3, 53—1710 Е 247719 (2640 Л 
， 每 人 5 张 )， 每 个 脸 26 个 维特 征 

% W 是 分 离 变 换算 了 泗 ，186384*28 的 矩阵 

[LowDimFaces, W] = fastPCA(FaceContainer, 20); % 主 成 分 
分 析 PCA 

visualize pc(W);% 显 示 主 成 分 脸 

save( 'Mat/LowDimFaces.mat', 'LowDimFaces'); 

01ѕр1ау('1 45%. '); 


ЖЧТ ТЕТ <> Н] БД 5 НУ X maino в 25% RJ ii 
H, KAREE [=] 8 222028. 





% 将 工程 所 在 文件 夹 PCA_ORL 添 加 到 系统 路 径 列表 


>> addpath(genpath('F:Ndoctor research\Matlab WorkNeboo 
К\РСА ORL')) 
>> main(20) % 提 取 前 26 个 主 成 分 ， 即 降 至 26 维 





上 述 命令 运行 后 会 在 Mat 目 录 下 生 
成 owDimFaces.mat” 文 件 ， 其 中 的 200x20 维 矩阵 
LowDimFaces 是 经 过 PCA 降 维 后 ， 原 样本 和 窍 阵 
FaceContainer 的 低 维 表示 。200 个 人 脸 样 本 所 对 应 
的 每 一 个 特征 同 量 由 原来 的 10304 维 变 成 了 20 维 ， 
这 就 将 后 美的 分 类 问题 变 为 了 一 个 在 20 维 空间 中 的 
划分 问题 ， 大 大 得 到 了 傈 化 。 


13.44 _ 主 成 分 脸 可 视 化 分 析 


fastPCAO 函 数 的 为 一 个 输出 为 主 分 量 隆 W , Е 
是 一 个 10304x20 的 窍 阵 ， 每 列 是 一 个 10304 维 的 主 
分 量 ( 样 本 协 方 过 矩阵 的 本 征 同 量 ) ， 在 人 上 脸 分 析 
中 ， 习 惯 称 之 为 主 成 分 脸 。 事 实 上 可 以 将 这 些 列 向 
量 以 112x92 的 分 辩 率 来 显示 ， 该 工作 由 函数 
visualize_pcO 完 成 ， 实 现 如 下 。 





function visualize pc(E) 

% 显示 主 成 分 分 量 〈 主 成 分 脸 ， 即 变换 空间 中 的 基 同 量 ) 
X 

% 输入 : E --- 和 矩阵， 每 一 列 是 一 个 主 成 分 分 量 


[size1 size2] = size(E); 


global imgRow; 
global imgCol; 
гом = imgRow; 
col = imgCol; 


if size2 ~= 20 
error( 只 用 于 显示 20 个 主 成 分 ' ) ; 
end; 


figure 
img = zeros(row, col); 
for ii = 1:20 
img(:) = E(:, li); 
subplot(4, 5, 11); 
imshow(img, []); 
end 


上 述 程序 运行 后 ，20 个 主 成 分 脸 如 图 13.15 所 
示 。 从 图 中 不 难 理解 为 什么 主 分 量 会 被 称 为 主 成 分 


脸 。 





413.15 ”20 个 主 成 分 脸 
1. 主 成 分 脸 的 定量 分 析 


回顾 公式 (10-20) : 


— ` 


k (Z; — m) 


1 


— 


(Lk = eL . (T; = т) == 


п] AEF, МА i PEHE a АУЕ m а НУВ — 26 
分 量 qijk (k =1,2,...„а')й е yura, АУЕ) ( 
т) (от) д ж TIK ЛЛ РЈ ДЛӨ НЛ e) 的 
AFR. йет, ХР |а] i-a) 的 每 一 
维 都 与 的 对 应 一 维 相 乘 。 因 此 ，ajx 可 以 看 成 是 对 
原 q 维 空间 中 辣 量 (a-5 ) 根 据 权 癌 量 a 的 一 种 加 权 求 
和 《线性 组 合 ) 。 而 作为 主 成 分 脸 ，a 的 各 维 分 量 


т 


KPEE Г ТЕРСАРЕЖ ЧЖЕН, T K22 56819 С 
ж-т) 各 个 维 分 量 的 重要 程度 。 


2， 疆 合 主 成 分 脸 图 像 的 分 本 


首先 ， 可 以 看 到 ， 图 13.15 中 的 所 有 20 个 主 成 分 
脸 图 像 的 一 个 共同 点 是 人 脸 区 域 之 外 的 图 像 背 景 相 
对 较 暗 ， 比 较 典 型 的 如 第 1 行 的 第 3 幅 图 像 ， 其 背景 
几乎 为 黑色 ， 这 是 因为 ORL 数 据 集 中 的 人 脸 图 像 背 
景 较为 均匀 一 致 ， 在 原始 d 维 空间 中 样本 在 对 应 背 
景 的 这 些 维 上 天 异 很 小 ， 从 样本 分 布 云 团 上 看 ， 这 
些 维 上 的 云 团 的 散布 最 小 ， 因 此 关 对 应 于 这 些 维 的 
加 权 系 数 很 小 ， 在 显现 出 的 图 像 中 就 是 灰 度 小 ， 从 
而 表现 为 主 成 分 脸 的 上 暗 背 景 。 


继续 按照 这 种 思路 分 析 ， 拿 第 1 个 主 成 分 脸 来 
说， 眉毛 、 咽 子 和 上 嘴唇 是 图 像 中 灰 度 相对 较 高 的 
区 域 ， 这 说 明 实 验 数 据 集 中 的 200 个 人 上 脸 之 间 在 这 
些 位 置 存 在 较 大 的 差异 ; 再 比如 第 1 行 的 第 5 个 主 成 
分 脸 ， 面 部 区 域 整体 亮度 较 遍 ， 这 可 能 是 由 数据 集 
人 脸 之 间 的 肤色 差异 导致 的 ， 其 他 典型 的 如 第 2 行 
的 第 3 个 以 及 第 3 行 的 第 2 个 主 成 分 脸 中 的 眼睛 ， 第 2 
行 第 1 个 以 及 第 4 行 第 2 个 主 成 分 脸 的 跨 ， 这 些 高 亮 
上 度 区 域 反 映 了 实验 数据 集中 人 脸 之 间 的 五 官 差 异 。 
此 外 ， 还 注意 到 同 为 五 官 之 一 的 鼻子 似乎 并 不 “ 抢 
眼 ?， 仅 第 3 行 的 第 1 幅 图 像 的 具 桨 区 域 亮 度 相 对 高 


06, Z HH EIB] ZJ ЕВУ À S КЖ ЕН = 22 [Нн] Ж 
ЛЛ, ЖЕРЛЕ ТЫ ЗАД n] IJ se [ТЕЛЕТ 8] X 
为 主 的 人 脸 识 别 中 的 作用 不 六 的 结论 相 一 致 。 


З. 降 维 对 分 类 性 能 的 影响 


人 类 能 够 识别 人 脸 ， 正 站 由 于 不 同 的 人 在 眼 
9. EASES EE ие ЕЈ. AV 
= (аё. ) 的 线性 变换 后 ， 原 始 d 维 空间 中 那些 
看 别 较 大 的 维 在 变换 全 低 维 空间 的 过 程 中 被 较 大 的 
ЛПС ТЯ РА: 而 那些 每 幅 人 上 脸 图 像 都 类 似 ( 缺 乏 区 
TID 的 特征 ， 如 表 景 、 时 了 于、 和 额头 等 伞 屿 以 了 
较 低 的 权 值 ， 从 而 在 d ' 维 空间 中 几乎 没有 得 到 体 
现 。 这 样 经 PCA 处 理 后 ， 在 特征 问 量 维 数 大 大 降低 
的 同时 ， 原 图 像 中 那些 型 弄 最 大 的 特征 被 最 大 程度 
的 保留 《以 一 种 线性 组 合 的 形式 ) ， 而 那些 相对 一 
D’ РА НУДЕ ОЕ ИГА Е 
人 很 多 情况 下 降 维 后 ， 分 类 的 识 列 紊 并 不 会 明显 下 降 
的 原因 。PCA 降 维 寺 和 工 东 些 特征 所 损失 的 信息 通过 
在 低 维 空间 中 更 加 精确 地 映射 可 以 得 到 补偿 ， 从 而 
аан 


4. PCA 能 够 很 好 工作 的 前 提 
细心 的 读者 可 能 会 友 现 ， 在 某 些 主 成 分 脸 图 像 


的 人 脸 按 缘 处 也 出 现 了 较 高 的 灰 度 ， 这 是 由 数据 集 
独 像 中 人 脸 姿 态 和 位 置 的 甜 异 造成 的 ， 竺 好 这 种 关 
异 不 大 《10% 左 右 ) 。 实 际 上 在 本 书 的 系统 中 ， 经 
过 PCA 降 维 后 的 20 维 样本 定 阵 能 够 很 好 地 用 于 人 脸 
识别 的 另 一 个 关键 点 在 于 OREL 人 脸 数 据 库 中 的 大 部 
TARERE HHE RDO, BRA 
RAK, ЗЕНА. = f. м=ЛШ HJ r Et КИ 
HHE. +), 2004 Л.Н Z [H]! 26 Pr l A" 
册 是 人 长 相 本 映 的 差异 了 ， 而 是 这 些 人 的 脸 部 区 域 
在 图 像 中 位 置 的 甜 异 ， 姿 态 的 和 差异， 以 及 需 官 位 置 
的 差异 了 。 当 然 ， 此 时 PCA 可 以 照常 计算 ， 但 将 降 
维 后 的 样本 矩阵 用 于 人 脸 识 别 束 不 会 取得 理想 的 识 


21124 了， 和 而 可 能 更 适合 十 姿态 分 类。 
13.45 ЖТ Orb] À JS HE E 


下 面 利 用 式 〈13-19) 来 实现 对 个 体 人 脸 图 像 
HEE., KPEE K approx. 以 胜任 这 一 工 
作 。 其 中 参数 x жүн Т ЖЛ ДЄ Ж, kk 是 
重建 使 用 的 主 分 量 数 上 日， 输出 xApprox 为 对 于 原样 
Ж [а] х 的 重建 〈 近 似 ) 。 具 体 实 现 如 下 。 





function [ xApprox ] = approx( x, k ) 


% 用 k 个 主 成 分 分 量 来 近似 《重建 ) 样本 x 


% 
% 
% 


输入 : x --- ERMETE PRIER, ЖОЛАН Ж 
k --- 近似 《重建 ) 使 用 的 主 分 量 数目 


о 


% 
% 输出 : хАрргох --- 样本 的 近似 (重建 ) 


о 


% EA РСА 变换 矩阵 v 和 平均 脸 meanVec 
load Mat/PCA.mat 


nLen = length(x); 
xApprox = meanvVec; 


for іі = 1:k 
xApprox=xApprox+((x-meanVec)*V(:,ii))*V(:,ii)'; 
end 


下 面 的 程序 分 别 采 用 了 50、100 和 200 个 主 分 量 
来 重建 原始 样本 同 量 x 。 其 中 国 数 displayImage (x 
‚А, w) 的 作用 为 将 同 量 x 按照 h xw BTI RKE 
ТТ. ZR o 


>> load Mat/FaceMat.mat % 载 入 样本 和 矩阵 

>> x = FaceContainer(1, :); % 第 一 个 人 脸 样 本 向 量 

>> displayImage(xApprox, 112 , 92); % 显示 原 图 像 

>> [pcaA V] = fastPCA( FaceContainer, 200 ); % 计算 266 个 
主 分 量 

>> xApprox = approx(x, 50); % 使 用 56 个 主 分 量 的 近似 
>> displayImage(xApprox, 112 , 92); 

>> xApprox = approx(x, 100); % 使 用 166 个 主 分 量 的 近 
>> displayImage(xApprox, 112 , 92); 

>> xApprox = approx(x, 200); % 使 用 266 个 主 分 量 的 近 
>> displayImage(xApprox, 112 , 92); 

>> dist = погт(хАрргох - x) % 计算 近似 的 差异 


似 
似 


dist = 


129.2606 





上 述 程序 最 后 利用 norm0O 函 数 计算 的 距离 表明 
当 使 用 200 个 主 分 量 进行 重建 时 ，xApprox 与 x 几乎 
没有 差异 〈 灰 度 范围 为 0 一 255 的 两 幅 112x92 的 图 像 
距离 仅 为 129) 。 原 始 图 像 的 重建 效果 如 图 13.16 所 
外。 





(a) 原始 样本 x 的 图 像 (b) 使 用 50 个 主 (c) 使 用 100 个 主 


(d) 使 用 200 个 主 分 量 的 重建 效果 
分 量 的 重建 效果 分 量 的 重建 效果 


413.16 ”使 用 50、100 和 200 个 主 分 量 对 原样 本 的 重建 效果 


图 13.16 (a) 和 图 (d) 实际 上 古 同 一 同 量 在 不 同 基 下 的 两 种 不 同 
表示 。 


13.5 ”局 部 二 进 制 模 式 


局 部 二 进 制 模式 (Local Binary Patterns ,LBP) 


最 早 是 作为 一 种 有 效 的 纹理 描述 算 子 提出 的 ， 由 于 
其 对 图 像 局 部 纹理 特征 的 旱 越 手绘 能 力 而 获得 了 十 
分 三 泛 的 应 用 。LBP 特 征 上 其 有 很 强 的 分 类 能 力 

(Highly Discriminative) 、 较 高 的 计算 效率 并 用 对 
村 单调 的 灰 度 变化 共有 不 变性 。 


13.5.1 基本 LBP 


多 13.17 给 出 了 一 个 基本 的 LBP 算 子 ， 应 用 LBP 
算 子 的 过 程 类 似 于 滤波 过 程 中 的 模板 操作 。 逐 行 扫 
搬 图 像 ， 对 于 图 像 中 的 每 一 个 像 双 点 ， 以 该 点 的 灰 
度 作 为 闷 值 ， 对 其 周围 3x3 的 8 邻 域 进行 二 值 化 ， 按 
照 一 定 的 顺序 将 二 值 化 的 结果 组 成 一 个 8 位 二 进 制 
以 此 二 进 制 数 的 值 (0255) 作为 该 点 的 响 
Wo 


Bınary: 10001011 


Threshold 
213 | 88 | 79 


Decimal: 139 





413.17 基本 LBP 算 子 


例如 对 于 图 13.17 中 的 3x3 区 域 的 中 心 点 ， 以 其 
灰 及 值 88 作 为 网 值 ， 对 其 8 邻 域 进行 二 值 化 ， 并 且 


ME EAF EIME [=] САУЛ Н] eME 
意 ， 只 要 统一 即 可 ) 将 二 值 化 的 结果 组 成 一 个 二 进 
制 数 10001011， 即 十 进 制 的 139， 作 为 中 心 点 的 啊 

应 。 在 整个 逐 行 扫 拉 过程 结束 后 ， 会 得 到 一 个 LBP 
I {Жж , ， 这 个 啊 应 图 像 的 直方 图 航 称 为 LBP 缤 

МАУ, skLBPE 5, ЕГЕУ 22 H 
别 工 作 的 特征 ， 因 此 也 被 称 为 LBP 特 征 。 


LBP 有 的 主要 思想 是 以 菜 一 点 与 其 邻 域 像 系 的 相 
对 灰 度 作为 啊 应 ， 正 是 这 种 相对 机 制 使 得 LBP 算 子 
对 于 单调 的 灰 度 变化 具有 不 变性 。 人 脸 图 像 钊 帝 会 
受到 光照 因 系 的 有 影响 而 产生 灰 硫 变化， 但 在 一 个 局 
部 区 域内 ， 这 种 变化 常常 可 以 外 视 为 是 蛙 调 的 ， 
кыта WJ A sil НУ "Р ERN E / 481 


13.5.2 ” 圆 形 邻 域 的 LBP PR 算 子 


基本 LBP 算 子 可 以 被 进一步 推广 为 使 用 不 同 大 
小 和 形状 的 邻 域 。 采 用 圆 形 的 邻 域 并 结合 双 线 性 插 
值 运算 使 操作 者 能 够 获得 任意 半径 和 任意 数目 的 邻 
域 像 系 点 。 图 13.18 给 出 了 一 个 半径 为 2 的 8 邻 域 像 系 
的 加 形 邻 域 ， 图 中 每 个 方 格 对 应 一 个 像 系 ， 对 于 正 
好 处 于 方 格 中 心 的 邻 域 点 ( 左 、 上 、 右 、 下 4 个 黑 
д) ， 直 接 以 该 点 所 在 方 格 的 像素 值 作为 它 的 信 ; 
对 于 不 在 像素 中 心 位 置 的 邻 域 点 〈 和 斜 45" 方 癌 的 4 个 





413.18 BJE (8,2) 邻 域 的 LBPss 算 子 


这 种 LBP 算 子 记 作 LBP рр, РМР 表示 P $E 
域 ，R 表示 圆 形 邻 域 的 六 和 任 。 

如 图 13.19 所 示 ， 位 于 图 像 中 第 i 行 和 第 j ZJ 
中 心 点 (其 灰 度 用 I Gi, j) 表示 ) 和 8 个 邻 域 点 用 


值 。 根 据 4.7.2 小 节 的 双 线性 插值 方法 ， 首 先 分 别 计 
算出 两 个 十 又 点 1 和 2 的 水 平 插值 ， 其 中 点 1 的 值 根 


据 与 之 处 于 同一 行 的 1 (Gi -2，j -2) 以 及 I (i -2，j -1) 的 
线性 插值 得 到 |: 


I (ї—1,]—1) 





I Ci-2,j-2)n_ 1 


2-42 


413.19 ”通过 双 线 性 插值 确定 个 在 像 系 中 心 位 置 的 邻 域 点 
( 斜 45" 方 同 的 4 个 大 点 ) 的 值 


value{l) = 1-2,3} — 2) + (2 — v2 x (Ili — 2. 下 一 二 一 了 一 了 一 也 


同 理 可 计算 出 点 2 的 值 : 


value(2) = I(i—1,i7—2)+{(2— v2) x (IG —1,.j—1)— IG 1,i;— 2)) 


用 计算 出 点 1 和 后 2 竖 直线 性 插值 : 


value = ualue(1) + (2 — V2) x (value(2) — ualue(1)) 


13.5.3 ”统一 化 LBP 算 子 一 -Uniform LBP 
及 其 MATLAB 实 现 


由 于 LBP 下 方 图 大 多 都 是 针对 图 像 中 的 各 个 分 
区 分 别 计算 的 ( 详 见 13.5.5 小 节 ) ， 对 于 一 个 普通 
大 小 的 分 块 区 域 ， 标 准 LBP 算 子 得 到 的 二 进 制 模式 
数目 “LBP 直方 图 收集 箱 数 目 ) 较 多 ， 而 实际 的 位 
于 访 分 其 区 域 中 的 像素 数目 却 相 对 较 少 ， 这 将 会 得 
到 一 个 过 于 稀 焉 的 直方 图 ， 从 而 使 直方 图 失去 统计 
意义 。 因 此 应 设法 减少 一 些 元 余 的 LBP 横 式 ， 同 时 
又 保留 足够 的 具有 重要 描绘 能 力 的 模式 。 


1. 理论 基础 


下 是 基于 以 上 考虑 ， 研 究 者 提出 了 统一 化 模式 
(Uniform Patterns) 的 概念 ， 这 是 对 LBP 算 子 的 又 
一 重大 改进 。 对 于 一 个 局 部 二 进 制 模 式 ， 在 将 其 二 
进 制 位 串 视 为 循环 的 情况 下 ， 如 果 其 中 包含 的 从 0 
到 1 或 者 从 1 到 0 转变 不 多 于 2 个 ， 则 称 这 个 局 部 二 进 
制 模 式 为 统一 化 模式 (Uniform Patterns) 。 例 如 ， 
模式 00000000 (0 个 转变 ) ，01110000 (2 个 转变 ) 
2111001111 (2 个 转变 ) 都 是 统一 化 模式 ， 而 模式 
11001001 (4 个 转变 ) 1101010011 (5 个 转变 ) 则 不 
是 。 


统一 化 模式 的 意义 在 于 : 在 随后 的 LBP 耳 方 图 


ШУИ phiri, АЗ ИЯ КЕ НУНА. J B 
收集 箱 (Сып), mA НАЕ И ЕЛА 
个 公用 收集 箱 ， 这 就 使 LBP 特 征 的 数目 大 大 减少 。 
一 般 来 说 ， 保 留 的 统一 化 的 模式 往往 是 反映 重要 信 
轧 的 那些 模式 ， 而 那些 非 统 一 化 模 陈 中 过 多 的 转变 
往往 由 噪声 引起 ， 不 其 有 民 好 的 统计 意义 。 


假设 图 像 分 块 区 域 大 小 为 18x20， 像 系 总 数 为 
360。 如 果 采 用 8 邻 域 像 系 的 标准 LBP 算 子 ， 收 集 箱 
(特征 ) 数目 为 256 个 ， 平 均 到 每 个 收集 箱 的 像素 
数目 还 不 到 2 个 〈360/256) ， 没 有 统计 意义 ; 而 统 
一 化 LBP 算 子 的 收集 箱 数 目 为 59 (58 个 统一 化 柑 陈 
收集 箱 加 上 1 个 非 统 一 化 模式 收集 箱 ) ， 平 均 每 个 
收集 箱 中 将 含有 6 个 元 右 像 对 0360/59) ， 更 具 统 计 
意义 。 对 16 邻 域 像素 而 言 ， 标 准 LBP 算 子 和 统一 化 
LBP 算 子 的 收集 箱 数 目 分 别 为 65536 和 243。 


统一 化 LBP 算 子 通常 记 作 rear 总 。 
2，MATLAB 实 现 
本 节 所 提供 的 全 部 源 代码 可 以 在 随 书 奉 赠 光盘 


中 的 LBP 工 具 箱 LBP Toolbox 中 找到 ， 使 用 时 可 通 
过 以 下 命令 将 工 其 稻 添 加 a 到 工作 路 径 。 





addpath(genpath('.. 改 为 您 存放 LBP 工 具 箱 的 相应 目录 ...\LBP Tool 
рох')) 


| 


LBP 算 子 具 有 一 定 的 半径 ， 类 似 于 模板 操作 ， 
这 里 同样 要 注意 LBP 算 子 应 用 过 程 中 的 边 寞 问题 。 
由 于 一 般 关 心 的 是 LBP 统 计 和 直方 和 网， 而 不 是 啊 应 网 
保本 里 ， 因 此 实现 中 一 般 不 需 同 外 填充 边界 ， 而 是 
下 接 在 计算 中 不 包括 图 像 的 边界 部 分 。 


№ Нв 锭 子 到 菏 个 分 块 图 像 并 获得 下 方 图 的 
实现 程序 如 下 。 


function [histLBP, MatLBP] = getLBPFea(I) 
ш 的 LBP 特 征 , (8,2),uniform 
: I --- ЗК 


回 值 : MatLBP --- LBP 响 应 和 矩阵 
histLBP --- 行 同 量 ，LBP 直 方 图 


% 获得 分 块 图 像 I 的 大 小 
1 = 


рми 


в. 
> 


Se 59 59 N ә 
т 


—; 
Ф 
ей 

II 

Ws 


if жр <= 2*rad) || (п <= 2*rad) 
error('I is +оо small to compute LBP Ғеа+иге!'); 
end 


MatLBP = zeros(m-2*rad, n-2*rad); 


% A LBP WI (КЛЕ УЕ КЕПИН ж 51 ЕЛАН) 
load Mat/LBPMap.mat; 


for ii = 1+rad : m-rad 


for jj = l+rad : n-rad 
nCnt = 1; 


% 计算 (8,2) 邻 域 的 像 系 伍 ， 不 在 像素 中 心 的 点 通过 双 线 性 
插值 获得 其 值 

nbPT(nCnt) = I(ii, jj-rad); 

nCnt = nCnt + 1; 


horInterp1 = I(ii-2, jj-2) + 0.5858*( I(ii-2, jj 
-1) - I(ii-2, jj-2) ); % 水 平方 向 插值 

horInterp2 = 1(11-1, jj-2) + 0.5858*( І(11-1, jj 
-1) - 1(11-1, jj-2) ); % 水 平方 向 插值 

verInterp = horInterp1 + 0.5858*( horInterp2 - h 
orInterp1 ); % “ЕИН 

nbPT(nCnt) = VerInterp ; 

nCnt = nCnt + 1; 


nbPT(nCnt) = I(ii-2, jj); 
nCnt = nCnt + 1; 


horInterp1 = I(ii-2, jj+1) + 0.4142*( I(ii-2, jj 
+2) - I(ii-2, jj+1) ); 

horInterp2 = I(ii-1, jj+1) + 0.4142*( I(ii-1, jj 
+2) - I(ii-1, jj+1) ); 

verInterp = horInterp1 + 0.5858*( horInterp2 - h 
orInterp1 ); 

nbPT(nCnt) = VerInterp ; 

nCnt = nCnt + 1; 


nbPT(nCnt) = I(ii, jj+2); 
nCnt = nCnt + 1; 


horInterp1 = 1(11+1, jj+1) + 0.4142*( I(ii+1, jj 
+2) - I(ii+1, jj+1) ); 

horInterp2 = I(ii+2, jj+1) + 0.4142*( I(ii+2, jj 
+2) - I(ii+2, jj+1) ); 


verInterp = horInterp1 + 0.4142*( horInterp2 - h 
orInterp1 ); 

nbPT(nCnt) = verInterp; 

nCnt = nCnt + 1; 


nbPT(nCnt) = I(ii+2, jj); 
nCnt = nCnt + 1; 


horInterp1 = 1(11+1, jj-2) + 0.5858*( І(11+1, jj 
-1) - I(ii+1, jj-2) ); 

horInterp2 = 1(11+2, jj-2) + 0.5858*( I(ii+2, jj 
-1) - I(ii+2, jj-1) ); 

verInterp = horInterp1 + 0.4142*( horInterp2 - h 
orInterp1 ); 

nbPT(nCnt) = VerInterp ; 


for iCnt = 1:nCnt 
if( nbPT(iCnt) >= I(ii, jj) ) 
MatLBP(ii-rad, jj-rad) = MatLBP(ii-rad, 
jj-rad) + 2^(nCnt-iCnt); 
end 
end 
end 
end 


% 计算 LBP 直 方 图 
histLBP = zeros(1, 59); % XF (8,2) uniformi H KHA 59 
个 收集 箱 


for ii = 1:m-2*rad 
for jj = 1:n-2*rad 
histLBP( vecLBPMap( MatLBP(ii, jj)+1 ) ) = histL 
BP( vecLBPMap( MatLBP(ii, jj)+1 ) ) + 1; 
end 
end 


| 


算法 中 围绕 每 一 个 中 心 点 ， 从 左 侧 开 始 ， 
按照 ЧЫ. 的 顺序 访问 8 个 邻 域 ， 形 成 二 渤 制 模式 
位 串 。 在 计算 直方 向 时 信 助 vecLBPMap 隐 射 表 将 啊 
应 独 像 MatLBP 中 的 像 妹 灰 度 映射 到 其 对 应 的 收集 
箱 编 号 。 如 灰 上 度 为 gray (О<дгау <255) КИ Л 
入 第 vecLBPMap (gray+1) 号 收集 箱 中 。 通 过 下 面 
的 函数 makeLBPMap 来 犹 得 映射 表 vecLBPMap。 


function vecLBPMap = makeLBPMap 


% 生成 (8， 2) ип і огт BP PLAY ARBUZ, 即将 256 个 灰 度 
值 映 射 到 59 个 收集 箱 中 ， 


% 所 有 的 非 uniform 放 入 一 个 收集 箱 中 
vecLBPMap = zeros(1, 256); % 初 始 化 映射 表 
bits = zeros(1, 8); %8 位 二 进 模式 上 串 
nCurBin = 1; 


for il = 0:255 
num = il; 


nCnt = 0; 


% 获得 灰 度 num 的 二 进 制 表 示 bits 

while (num) 
bits(8-nCnt) = mod(num, 2); 
пит = floor( num / 2 ); 
nCnt = nCnt + 1; 

end 


if IsUniform(bits) % 判断 bits 是 不 是 uniform 模 式 
vecLBPMap(ii+1) = nCurBin; % 每 个 uniform 模 式 分 配 


一 个 收集 箱 
nCurBin = nCurBin + 1; 
else 
vecLBPMap(ii+1) = 59; % 所 有 非 uniform 模 式 都 放 入 第 5 
9 W 4 48 
end 
end 


% 剑 存 映射 表 
save( 'Mat/LBPMap.mat', 'vecLBPMap'); 


K žrmakeLBPMap t iB H] y IsUniform (bits) 
MERKRA НЯ з Н bits Л 
(Uniform Patterns) ，IsUniform 方 法 的 实现 如 下 。 


function bUni = IsUniform(bits) 
% ЭМ АУ К bits 是 否 是 uniform 模式 


% 输入 : bits --- 二 进 制 LBP 模 式 串 
% 
% 返回 值 : buni --- =1, if bits 是 uniform 模 式 捉 ，=2，if bi 


ts 不 是 uniform 模 式 串 
n = length(bits); 
nJmp = 0; % 位 跳 变 数 (@->1 or 1->0) 


for ii = 1 : (п-1) 
if( bits(ii) ~= bits(ii+1) ) 


nJmp = nJmp+1; 
end 
end 
if bits(n) ~= bits(1) 
nJmp = nJmp+1; 
end 


if nJmp > 2 

bUni = false; 
else 

bUni = true; 
end 





13.5.4 MB-LBP 及 其 MATLAB 实 现 


1. 理论 基础 


有 前述 的 基于 像 系 相对 灰 度 比较 的 BP$r 算 子 可 以 
很 精细 地 摘 述 图 像 局 部 的 纹理 信息 。 然 而 ， 也 正 是 
由 于 这 种 特征 的 局 部 化 特点 ， 使 它 易 受 噪 声 的 影 啊 
而 不 够 健 半 (Robust) ， 和 坝 乏 对 几 像 整体 信息 的 钥 
粒度 把 握 。 因 此 MB-LBP (Multi-Block Local Binary 
Patterns) 被 提出 以 弥补 传统 LBP 的 这 一 不 足 。 起 杨 
MB-LBP 被 作为 标准 3x3LBP 的 扩展 而 引入 ， 随 后 
也 被 用 于 与 IPAa 算 子 结合 使 用 。 在 MB-LBP 的 计算 
中 ， 传 统 LBP 宽 子 像 系 值 之 则 的 比较 被 像 系 块 
(sub-block) ŻA FIJE ERRE, mB 
13.2007. ARARA RRRA АУ [Б] ЇЇ) АИ ЖЖП 


ЛТА ЛВ ЕД у МВ. -LBP& КА K | 
JIS xS ҢЈіВР 算 子 。 





(a) MB， LBP2 (b) мвВ,-1.вр 


6413.20 MB-LBP 算 子 


Е: 图 中 每 个 灰色 细 线 的 小 方 格 代 表 一 个 像素 ， 每 
个 黑色 粗 线 围 成 的 大 方 格 代 表 一 个 像 系 块 ， 其 值 是 
由 其 中 3x3 共 9 个 像 际 的 灰 度 平均 而 得 的 。 


2. MATLAB 实 现 


下 面 分 别 给 出 应 用 MB, -LBP8; 算 子 和 MB3-LBP8; 算 
子 到 某 一 图 像 分 区 [的 MATLAB 算 法 实现 。 


(1) 提取 MB; -LBP& 特征 。 
算法 getMBLBPFea0 的 输入 biockSize 为 块 的 大 


小 ， 即 MB.-IBzP 总 中 的 S ， 其 默认 值 为 1， 即 1 个 块 仅 
为 1 个 像素 ， 对 应 传统 的 IEP 咏 算 子 。 因 此 ， 在 13.5.3 


小 节 的 getLBPFea0 算 法 可 以 看 作 是 本 算法 的 特例 。 
为 了 求 得 I 中 各 个 像 系 块 的 值 ， 首 先 计 算 像 系 块 中 
像素 的 平均 灰 度 ， 而 后 以 此 平均 灰 度 作为 灰 度 信 ， 
k Y 的 低 儿 > 状 率 表示 [MB ， 此 后 的 国 值 化 操作 
只 需 对 I_MB 进行 ， 国 值 化 过 程 和 getLBPFea0 中 类 
D 


function [histLBP, MatLBP, MatLBP MB] = getMBLBPFea(I, 
blockSize) 


% 计算 分 块 区 域 I 的 LBP 特 征 ,(8,2) ,uniform 


输入 : I --- 分 区 图 像 
blockSize --- MBLBP 中 的 分 块 大 小 ， 上 默认 值 为 1 


返回 值 : MatLBP --- LBP 响应 矩阵 
histLBP --- 1710], LBP Л 
MatLBP MB --- MBLBP 的 像素 块 低 分 辨 率 表示 


SS éS 55 55 585 55 58 XN 


1f nargin < 2 
blockSize = 1; 
епа 


% ЭЕ SAI АЛУ 
[m n] = 


size(I); 


% 将 原始 图 像 依据 blockSize DR, MRAR REFIJE, XM 
保存 在 映射 窍 阵 І мВ rH 

mSub = floor(m / blockSize); 

nSub = floor(n / blockSize); 


mRem = mod(m, blockSize); 
nRem = mod(n, blockSize); 
mRem = round(mRem / 2); 


nRem = round(nRem / 2); 
І MB = zeros(mSub, nSub); 


for ii = 1:mSub 
for jj = 1:nSub 
I center = I( 1+mRem:mRem+mSub*blockSize, 1+пКет 
:nRem+nSub*blockSize ); % 取 中 心 区 域 ， 不 够 分 出 整 块 的 留 在 两 
ыл 
SubRgn = I center( (ii-1)*blockSize+1 : ii*block 
Size, (jj-1)*blockSize+1 : jj*blockSize ); 
I MB(ii, jj) = mean( SubRgn(:) ); 
end 
end 


% 剩 下 的 任务 就 是 对 分 块 矩阵 的 映射 І МВ 计算 blockSize = 1 
的 uniform (8, 2) LBP 特 征 了 
rad = 2; 
if (mSub <= 2*rad) || (nSub <= 2*rad) 

error('I is too small to compute LBP feature!'); 
end 


MatLBP_MB = zeros(mSub-2*rad, nSub-2*rad); 


% PEA LBP WIJ (КЕ УЕ ИЕА 51 ЕЛАН) 
load Mat/LBPMap.mat; 


for il = 1+rad : mSub-rad 
for jj = 1+rad : nSub-rad 
nCnt = 1; 


% tT (8, 2) BRIAR DERA P OA АНХА EE 
插值 获得 其 值 


nbPT(nCnt) = I MB(ii, jj-rad); 
nCnt = nCnt + 1; 


horInterp1 = І MB(ii-2, jj-2) + 0.5858*( І MB(ii 
-2, jj-1) - I_MB(ii-2, jj-2) ); % 水 平方 向 插值 

horInterp2 = I МВ(11-1, jj-2) + 0.5858*( І MB(ii 
-1, jj-1) - 1_МВ(11-1, jj-2) ); % 水 平方 向 插值 

verInterp = horInterp1 + 0.5858*( horInterp2 - h 
orInterp1 ); % АИА 

nbPT(nCnt) = verInterp; 

nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii-2, jj); 
nCnt = nCnt + 1; 


horInterp1 = I MB(ii-2, jj+1) + 0.4142*( І MB(ii 
-2, jj+2) - I_MB(ii-2, jj+1) ); 

horInterp2 = I МВ(11-1, jj+1) + 0.4142*( І MB(ii 
-1, jj+2) - I_MB(ii-1, jj+1) ); 

verInterp = horInterp1 + 0.5858*( horInterp2 - h 
orInterp1 ); 

nbPT(nCnt) = verInterp; 

nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii, jj+2); 
nCnt = nCnt + 1; 


horInterp1 = I MB(ii+1, jj+1) + 0.4142*( І MB(ii 
+1, jj+2) - I МВ(11+1, jj+1) ); 

horInterp2 = I MB(ii+2, јј+1) + 0.4142*( І MB(ii 
+2, jj+2) - I MB(ii+2, jj+1) ); 

verInterp = horInterp1 + 0.4142*( horInterp2 - h 
orInterp1 ); 

nbPT(nCnt) = verInterp; 

nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii+2, jj); 
nCnt = nCnt + 1; 


horInterp1 = I MB(ii+1, jj-2) + 0.5858*( І MB(ii 
+1, jj-1) - І МВ(11+1, jj-2) ); 

horInterp2 = I MB(ii+2, jj-2) + 0.5858*( І MB(ii 
+2, jj-1) - I_MB(ii+2, jj-1) ); 

verInterp = horInterp1 + 0.4142*( horInterp2 - h 
orInterp1 ); 

nbPT(nCnt) = verInterp; 


for iCnt = 1:nCnt 
if( nbPT(iCnt) >= I MB(ii, jj) ) 
MatLBP MB(ii-rad, jj-rad) = MatLBP MB(ii 
-rad, jj-rad) + 2^(nCnt-iCnt); 
end 
end 
end 
end 


% 还 原 MatLBP МВ 
MatLBP = zeros(m-2*rad*blockSize, n-2*rad*blockSize); 
for ii = 1:mSub-2*rad 

for jj = 1:nSub-2*rad 

MatLBP( mRem+(ii-1)*blockSize+1 : mRem+ii*blockS 

ize, nRem+(jj-1)*blockSize+1 : nRem+jj*blockSize ) = Ma 
tLBP MB(ii, jj); 

end 
end 


% 计算 LBP 直 方 图 
histLBP = zeros(1, 59); % 对 于 (8,2) 的 uniform 直 方 几 共有 59 
个 收集 箱 


for ii = 1:mSub-2*rad 
for jj = 1:nSub-2*rad 
histLBP( vecLBPMap( MatLBP MB(ii, JJ)+1 ) ) = hi 
stLBP( vecLBPMap( MatLBP MB(ii, jj)+1 ) ) + 1; 
end 
end 





(2) ДЕҢДМВ.-1вР% ЙЕ, 


function [histLBP, MatLBP, MatLBP MB] = getMBLBPFea 33( 
I, blockSize) 
% 计算 分 区 图 像 I 的 LBP 特 征 ,3*3,uniform 


% return value: MatLBP --- LBP ЛУ [Е 
histLBP --- 475] =, LBP 直方 图 


SS 58 


blockSize --- MBLBP 中 的 分 块 大 小 ， 默 认 值 为 


输入 : I --- 分 区 图 像 
blockSize --- 块 的 大 小 


返回 值 : MatLBP --- LBP 响应 和 矩阵 
histLBP --- 1], LBP 直方 图 
MatLBP MB --- MBLBP 的 像素 块 低 分 辩 率 表示 


SS éS 55 55 55 55 55 P 


1f nargin < 2 
blockSize = 1; 
епа 


% RENKER 
n] 


[m = size(I); 


% 将 原始 图 像 依据 blockSize DR, ТТКН, АУ 
你 存在 映射 窍 阵 т мв 中 


mSub = Ғ1оог(т / blockSize); 
nSub = floor(n / blockSize); 


mRem = mod(m, blockSize); 
nRem = mod(n, blockSize); 
mRem = round(mRem / 2); 
nRem = round(nRem / 2); 


I MB = zeros(mSub, nSub); 


for ii = 1:mSub 
for jj = 1:nSub 
I center = I( 1+mRem:mRem+mSub*blockSize, 1+пКет 
:nRem+nSub*blockSize ); % 取 中 心 区 域 ， 不 够 分 出 整 块 的 留 在 两 
| 
SubRgn = I center( (ii-1)*blockSize+1 : ii*block 
Size, (jJ)-1)*blockSize+1 : jj*blockSize ); 
I MB(ii, jj) = mean( SubRgn(:) ); 
end 
end 


% 剩 下 的 任务 就 是 对 分 块 矩阵 的 映射 І МВ 计算 blockSize = 1 
的 uniform 3*3 LBP 特 征 了 
rad = 1; 
if (mSub <= 2*rad) || (nSub <= 2*rad) 

error('I is too small to compute LBP feature!'); 
end 


MatLBP_MB = zeros(mSub-2*rad, nSub-2*rad); 


% БЕЛА. LBP ШАЙ] (BRKE SEAN ИЕА 51 ЕЛАН) 
load Mat/LBPMap.mat; 


for il = l+rad : mSub-rad 
for jj = 1+rad : nSub-rad 


% 计算 3*3 邻 域 的 像素 值 
nbPT(nCnt) = I_MB(ii-rad, jj-rad); 
nCnt = nCnt + 1; 


nbPT(nCnt) = I_MB(ii-rad, jj); 
nCnt = nCnt + 1; 


nbPT(nCnt) = І MB(ii-rad, jj+rad); 
nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii, jj+rad); 
nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii+rad, jj+rad); 
nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii+rad, jj); 
nCnt = nCnt + 1; 


nbPT(nCnt) = I_MB(ii+rad, jj-rad); 
nCnt = nCnt + 1; 


nbPT(nCnt) = I MB(ii, jj-rad); 


for iCnt = 1:nCnt 
if( nbPT(iCnt) >= I MB(ii, jj) ) 
MatLBP MB(ii-rad, jj-rad) = MatLBP MB(ii 
-rad, jj-rad) + 2^(nCnt-iCnt); 
end 
end 
end 
end 


% 还 原 MatLBP MB 
MatLBP = zeros(m-2*rad*blockSize, n-2*rad*blockSize); 
for іі = 1:mSub-2*rad 

for jj = l:nSub-2*rad 

MatLBP( mRem+(ii-1)*blockSize+1 : mRem+ii*blockS 

ize, nRem+(jj-1)*blockSize+1 : nRem+jj*blockSize ) = Ma 
tLBP MB(ii, jj); 

end 
end 


% 计算 LBP 直 方 图 
histLBP = zeros(1, 59); % 对 于 (8,2)H 四 uniform 耳 方 图 共有 59 
个 收集 箱 


for ii = 1:mSub-2*rad 
for jj = 1:nSub-2*rad 
histLBP( vecLBPMap( MatLBP MB(ii, jj)+1 ) ) = hi 
stLBP( vecLBPMap( MatLBP MB(ii, jj)+1 ) ) + 1; 
end 
end 


【 例 13.3】 经 过 MB, - LBP% 滤波 的 人 上 脸 图 像 。 


分 别 | У ДУ мв - LBPš2 、 МВ›—1ВРф 和 MBs - LBP Са 
对 图 13.21 (а) 中 图 像 进 行 特征 提取 的 MATLAB 程 
Рд КРТ. 





>> І = imread('mh gray.bmp'); % 访 入 图 像 
>> [hist1, І LBP1] = getMBLBPFea(I, 1); 


>> [hist2, І 1ВР2] getMBLBPFea(I, 2); 
>> [hist3, І LBP3] getMBLBPFea(I, 3); 
>> figure, imshow(I LBP1, []) % 得 到 图 13.21(b) 


>> figure, imshow(I LBP2, []) % 得 到 图 13.21(c) 
>> figure, imshow(I LBP3, []) % 得 到 图 13.21(d) 


БИ Рат a ЖУ ИШ 13.21 (b) 、 图 
13.21 (с) ~ 13.21 (d) 所 示 。 


图 13.21 (b) ~ 13.21 (c) . [13.21 (d) 分 
ж) 74 13.21 (а) Зу] мв-1ВР:% ‚ MB:-LBP¥3 }Пмвз-1вр:% + 
子 滤波 之 后 的 啊 应 图 像 。 注 意 3 幅 啊 应 图 像 中 LBP 
算 子 的 强大 纹理 揪 给 能力， 同时 应 看 到 随 看 像 系 块 
大 小 S 的 增加 ， 啊 应 图 像 中 纹理 增 粗 并 且 趋 于 稳 
定 ， 说 明 对 相对 较 大 S 的 LBP 直 方 图 的 分 析 将 有 助 





(a) 原 图 像 (b) 经 MB,-LBP, 滤波 后 (c) 经 MB-—LBP,; 滤波 后 (d) 经 MB:-LBPs: 滤波 后 


图 13.21 ”经 过 MB ç -LBP 总 滤波 的 人 脸 图 像 


13.5.5 ”图像 分 区 及 其 MATLAB 实 现 


在 13.2.2 小 三 曾 拓 a 到， 作为 图 像 的 1 了 统计 特 
任 ， 耻 方 图 无 法 拍 述 图 像 的 结构 信息 。 而 图 像 各 个 


区 域 的 局 部 特征 往往 差异 较 大 ， 如 末 仅 对 整个 网 像 
生成 一 个 LBP 直 方 图 ， 这 些 局 部 的 差异 信息 就 会 于 
失 。 分 区 LBP 特 征 可 有 效 解决 这 一 问题 。 


基体 的 方法 是 将 一 幅 岁 像 适 当地 划分 为 P xQ 
个 分 区 (Partition) ， 然 后 分 别 计 算 每 个 图 像 分 区 
的 耻 方 图 特征 ， 最 后 再 将 所 有 块 的 直方 图 特征 连接 
成 一 个 复合 的 特征 问 量 “(Composite Feature) 作为 
代表 整个 图 像 的 LBP 下 方 图 特征 。 


1. 分 区 六 小 的 选择 


理论 上 ， 越 小 越 精 细 的 分 区 意味 看 更 好 的 局 部 
描述 能 力 ， 但 同时 会 产生 更 高 维 数 的 复合 特征 。 然 
而 过 小 的 分 区 会 造成 下 方 图 过 于 稀 玖 从 而 失去 统计 
意义 。 在 文献 [7] 人 上 脸 识别 的 应 用 中 选择 了 18х21) 
分 区 大 小 ， 这 可 以 作为 对 于 一 般 问 题 的 指导 性 的 标 
准 ， 因 为 它 是 一 个 精确 描述 能 力 与 特征 复杂 上 度 的 民 
好 折 中 。 在 表情 识别 中 更 小 一 些 (010x15) 的 分 
区 被 证 明 [8，9] 能 够 获得 更 好 的 分 类 能 力 。 这 里 分 
区 大 小 的 时 位 是 MB-LBP 的 像 系 块 (Block) 。 如 对 
于 传统 LBP， 每 个 分 区 大 小 取 (18x21) 像素 ， 则 
Xf Fre- ， 分 区 大 小 应 取 (18х21) BRER 
= (54x63) 像素 。 


2. 分 区 ELBP 的 MATLAB 实 现 


本 节 编 写 了 getLBPHist (1, r, c, nMB) bÉ 
数 用 来 提取 图 像 1 的 分 区 LBP 特 征 。 其 输入 r 和 c 分 
别 代 表 分 区 的 行 数 和 列 数 ，nMB 给 出 了 MB-LBP 像 
系 块 的 大 小 。 函 数 返 回 一 个 同 量 ， 它 是 图 像 1 的 复 
合 LBP 特 征 。 


function histLBP = getLBPHist(I, r, c, nMB) 
% 取得 I 的 分 区 LBP 直方 图 


=}; 


А: mc --- ЛКЕН, пс 
nMB --- MB-LBP 中 块 的 大 小 


SS 55 XN XN 


% 返回 值 : histLBP --- ”连接 І 的 各 个 分 块 的 LBP 直 方 图 而 形成 的 
代表 I 的 LBP 复 合 特征 向 量 


[m n] = size(I); 
% 计算 分 区 的 大 小 


mPartitionSize 
nPartitionSize 


floor(m / r); 
floor(n / c); 


for іі = 1:r-1 
for jj = 1:с-1 
Sub = I( (ii-1)*mPartitionSize+1:ii*mPartitionSi 
ге, (jj-1)*nPartitionSize+1:jj* 
nPartitionSize ); 
hist{ii}{jj} = getMBLBPFea( Sub, nMB ); % 如 需 提 
取 3*3LBP， 请 注释 此 行 


% hist{ii}{jj} = getMBLBPFea 33( Sub, nMB ); % 如 
需 提 取 3*3LBP， 请 打开 此 注释 
end 


end 


% 处 理 最 后 一 行 和 最 后 一 列 
clear Sub 
for ii = 1:r-1 
Sub = I( (ii-1)*mPartitionSize+1:ii*mPartitionSize, 
(c-1)*nPartitionSize+1:n ); 
hist{ii}{c} = getMBLBPFea(Sub, nMB); 
% hist{ii}{c} = getMBLBPFea_33( Sub, nMB ); 
end 
clear Sub 


for jj = 1:c-1 
Sub = I( (r-1)*mPartitionSize+1:m, (jj-1)*nPartitio 
nSize+1:jj*nPartitionSize ); 
hist{r}{jj} = getMBLBPFea(Sub, nMB); 
% hist{r}{jj} = getMBLBPFea_33( Sub, nMB ); 
end 
clear Sub 


Sub = I((r-1)*mPartitionSize+1:m, (c-1)*nPartitionSize+ 
1:п); 

hist{r}{c} = getMBLBPFea(Sub, nMB); 

%hist{r}{c} = getMBLBPFea 33( Sub, nMB ); 


% 连接 各 个 分 块 的 LBP 直 方 图 形成 复合 特征 向 量 
histLBP = zeros(1, Ө); 
To олш = op 
for jj = 1:c 
histLBP = [histLBP hist{ii}{jj}]; 
end 
end 


驮 认 情 况 下 函数 getLBPHist() 提 取 (8,2) 圆 形 令 
域 的 LBP 特 征 。 如 果 和 需要 提取 3x3 的 LBP 特 征 ， 请 将 


代码 中 getMBLBPFea 的 调用 替换 为 
getMBLBPFea_33 的 调用 。 


【 例 13.4】 获得 一 幅 图 像 的 复合 LBP 下 方 匈 特 
征 。 


以 不 同 的 分 区 数目 和 不 同 的 块 大 小 从 图 
13.22 (а) 中 提取 分 区 LBP 特 征 的 程序 如 下 。 


>> І = imread('mh gray.bmp' ); % 读 入 图 像 

>> histLBP1 = getLBPHist(I, 14, 13, 1); % 按 照 14x13 分 区 后 
像 系 块 大 小 为 1 的 复合 LBP 直 方 图 特征 

>> histLBP2 = getLBPHist(I, 7, 6, 2); % 按 照 7x6 分 区 后 像素 
块 大 小 为 2 的 复合 LBP 直 方 图 特征 

>> histLBP3 = getLBPHist(I, 5, 4, 3); % 按 照 5x4 分 区 后 像素 


块 大 小 为 3 的 复合 LBP 直 方 图 特征 

>> figure, plot(histLBP1) % 得 到 图 13.22(b) 
>> figure, plot(histLBP2) % 得 到 图 13.22(c) 
>> figure, plot(histLBP3) % 得 到 图 13.22(d) 





ERFT TA ЖИ 13.22 (b) ~ B 
13.22 (с) ЖШ 13.22 (d) 所 示 。 


图 13.22 (b) ‚ 13.22 (с) 和 图 13.22 (d) 分 
别 为 对 图 13.22 (а) 中 图 像 的 复合 LBP 和 直方 图 。 注 
意 为 保证 每 个 分 区 中 的 像 系 块 个 数 基 本 相同 〈 约 为 
18х21), ТЛ 91 (MB: -LBP ) ， 采 用 较 大 
的 分 区 数目 ， 如 图 13.22 b) 中 分 区 数 为 14x13， 


这 样 每 个 分 区 中 约 包含 19x20 个 像素 块 ， 而 对 于 较 
大 的 像素 块 (мв: -LBP ) ， 选 择 较 小 的 分 区 数目 ， 
如 图 13.22 (а) 中 分 区 数 为 5x4， 这 样 每 个 分 区 中 
弘 包 含 17x21 个 像 系 块 。 由 于 每 个 分 区 的 uniform 
LBP 直 方 图 (向量) 维 数 均 为 59， 图 13.22 (a) 中 
得 到 的 是 一 个 14x13x59 = 10738 维 的 直方 图 ( [nj 
ҥш), 13.22 (c) 中 为 一 个 5x4x59 = 11802 E. 
Л Сиш) 。 这 也 说 明了 越 小 越 精细 的 分 区 〈 分 
区 数目 较 多 ) 在 提供 更 好 的 局 部 摘 述 能 力 的 同时 会 
产生 更 高 维 数 的 复合 特征 。 
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(a) 原 图 像 
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(c) 原 图 按照 7x6 分 区 后 像素 块 大 小 为 2 的 复合 LBP 直 方 图 (d) 原 图 按照 5x4 分 区 后 像素 块 大 小 为 3 的 复合 LBP 直 方 图 


图 13.22 ”复合 LBP 直 方 图 特征 


对 于 最 终 得 到 的 这 个 复合 LBP 直 方 图 ， 既 可 以 
将 它 了 直接 作为 1 个 代表 图 像 的 符 征 问 量 来 使 用 ， 也 
可 以 有 来 用 13.2.2 小 节 中 介绍 的 方法 进一步 捉 取 其 乡 
计 特 征 。 


第 14 章 ”图像 识 别人 初步 

表面 章节 中 介绍 的 众多 的 图 像 处 理 技术 主要 束 
是 为 图 像 识 别 服务 的 ， 而 从 第 14 章 开始 将 正式 转 入 
图 像 识别 领域 。 退 过 本 章 的 学 习 ， 斌 者 可 以 建 并 起 
对 图 像 识 别 乃 至 一 般 的 模式 识别 问题 的 基本 认识 ， 
学 习 和 向 握 解决 识别 问题 的 一 般 思 路 。 此 外 ，14.3 
节 还 将 介绍 最 小 距离 分 类 和 模板 匹配 的 简 蛙 技术 。 
可 以 说 从 现在 开始 ， 本 书 对 机 器 视 党 的 探究 将 渐 入 
ГҮЛ © 
本 章 的 知识 和 技术 热点 

(1) 模式 与 模式 识别 的 基本 概念 

(2) FEWE 

(3) 最 小 距离 分 类 器 

(4) 基于 相关 的 模板 匹配 
本 章 的 典型 案例 分 析 

(1) 基于 最 小 距离 分 类 可 的 访 尾 属 植 物 分 类 


(2) 基于 相关 技术 的 图 像 模式 匹配 


14.1 模式 识别 概述 


模式 识别 (Pattern Recognition ) 是 人 类 的 一 
项 基本 智能 ， 在 日 涅 生活 中 ， 人 们 经 党 在 进行 “ 模 
式 识别 >”。 随 着 20 世 纪 40 年 代 计 算 机 的 出 现 以 及 20 
世纪 50 年 代 人 工 镶 能 的 兴起 ， 人 们 当然 也 希望 能 用 
计算 机 来 代 符 或 扩展 人 类 的 部 分 脑力 开动 。 GR 
BL) 模式 识别 在 20 世 纪 60 年 代 初 迅速 发 展 并 成 为 一 
ПТВ. 


1. RAIAR] 


模 陈 征 由 确定 的 和 随机 的 成 分 组 成 的 物体 、 过 
о ада 
的 对 象 。 


模式 识别 是 指 对 表征 事物 或 现象 的 各 种 形式 的 
( 数 信 的 、 文 字 的 和 刻 辑 关系 的 ) 信息 进行 处 理 和 和 
分 析 ， 以 对 事物 或 现象 进行 手 述 、 间 认 、 分 类 和 人 解 
释 的 过 程 ， 价 日 地 说 束 是 应 用 计算 机 对 一 组 事件 或 
过 程 进行 鉴别 和 分 类 ，。 

本 节 所 指 的 模式 识别 主要 是 对 语音 波形 、 地 震 
Wk. OER, WER ҤЕ, BER ж, 45. 
ааа 
和 辨识。 


模式 识别 与 统计 学 、 心 理学 、 语 言 学 、 计 算 机 
科学 、 生 物 学 、 控 制 论 等 都 有 关系 。 它 与 人 工 重 
能 、 图 像 处 理 的 研究 有 交叉 关系 。 例 如 目 适 应 或 目 
组 织 的 模式 识别 系统 包含 了 了 人工 入 能 的 学 习 机 制 ; 
人 工 和 镶 能 研究 的 景物 理解 、 上 日 然 语言 理解 也 包含 模 
式 识 列 问 题 。 义 如 模式 识 列 中 的 预 处 理 和 特征 提取 
эр ти ze M H] EAK ab 5 АЧ: 而 图 像 处 理 中 的 图 
АТ B E E УЛЯ УЯ ЖШ a o 


2. 图 像 识 别 


将 模式 识 列 的 方法 和 拉 术 应 用 于 图 像 领域 ， 即 
当 识 别 的 对 象 是 图 像 时 融 称 为 图 像 识 询 o BAX 
和 人 闫 而 言 ， 理 解 和 识别 所 看 匈 的 东西 似乎 是 一 件 再 
平 第 不 过 的 事情 ， 但 让 计算 机 具有 类 似 的 鲁能 却 古 
一 项 极 具 挑 成 性 的 任务 ， 然 而 两 者 在 很 多 环节 上 十 
ЛН У, РАЛ А ДЕЛИ ЛОЯ ЖЕТИН, ЗАТ 
wš JS ЛА. 


IE Wl IE Р ат r, ЛАНА е2 
У Н ВАЖНОЕ, ТЫ НЕД Hr AE 
BRRIP, MRA ЕА Е ШИНА, BRA 
ат Ж ҤИн д, НАИ ИНА J АНУ 
信息 进行 比较 的 加 工 过 程 ， 才 能 实现 对 图 像 的 再 
认 。 这 一 扣 和 计算 机 的 识 列 中 ， 圾 要 和 完 学 习 一 些 已 
经 类 列 的 样本 训练 样本 ) ， 才 能 识别 那些 类 别 未 


ХИ НУРАХ СШДЕ ДЖ) 是 相似 的 。 


人 的 图 像 识 别 能 力 是 很 强 的 。 图 像 距 离 的 改变 
或 图 像 在 感觉 器 官 上 作用 位 置 的 改变 ， 都 会 造成 图 
像 在 视网膜 上 的 大 小 和 形状 的 改变 ， 即 使 在 这 种 情 
况 下 ， 人 们 仍然 可 以 认 出 他 们 过 去 知觉 过 的 图 像 ， 
此 外 ， 人 类 还 具有 非凡 的 3D 重 建 能 力 ， 比 如 说 可 能 
只 见 过 某 人 的 正面 照片 ， 但 可 以 认 出 此 人 的 侧 脸 其 
至 是 背 脸 。 从 这 个 意义 上 说 ， 目 前 计算 机 的 识别 能 
力 与 人 类 就 相差 甚 远 了 。 


图 像 识 别 可 能 是 以 图 像 的 主要 特征 为 基础 的 。 
每 个 图 像 都 有 它 的 特征 ， 如 字母 A 有 个 尖 ，P 有 个 
疼 、 而 Y 的 中 心 有 个 馈 角 守 。 相 关 研 究 表 明 ， 识 别 
时 视线 总 是 集中 在 图 像 的 主要 特征 上 ， 也 就 是 集中 
在 图 像 轮廓 曲 度 最 大 或 轮 廊 方向 突然 改变 的 地 方 ， 
这 些 地 方 的 信息 量 最 大 。 而 且 有 眼睛 的 扫描 路 线 也 总 
是 依次 从 一 个 特征 转 到 另 一 个 特征 上 。 由 些 可见， 
在 图 像 识 别 过 程 中 ， 知 沉 机 制 必须 排除 输入 的 多 余 
信息 ， 抽 出 关键 的 信息 。 同 时 ， 在 大 脑 里 必定 有 一 
个 负责 整合 信息 的 机 制 ， 它 能 把 分 阶段 获得 的 信息 
整理 成 一 个 完整 的 知 党 映 象 。 这 一 点 正好 说 明了 图 
像 识 别 中 特征 提取 的 必要 性 。 


图 像 识 列 中 着 名 的 的 模板 匹配 模型 认为 ， 要 识 
别 示 个 图 像 ， 必 须 在 过 去 的 经 验 中 有 这 个 图 像 的 记 


CRG ХИМ» АНУС ЕВЕ J АЛИН ВЈ 
МЯН АС, SARRERA 了。 例如 有 一 个 子 
母 A， 如 未 在 脑 中 有 个 A 模 板 ， 衬 母 A 的 大 小 、 方 
位 、 形 状 部 与 这 个 A 模板 完全 一 人 怪 ， 了 字母 A 丈 被 识 
别 了 。 但 这 种 模型 强调 图 像 必 须 与 脑 中 的 模板 完全 
匹配 才能 成 功 识 别 ， 而 事实 上 和 不仅 能 识别 与 脑 中 
的 模板 完全 一 致 的 图 像 ， 也 能 识别 与 模板 不 完全 一 
致 的 图 像 。 例 如 ， 人 们 不 仅 能 识 列 东 一 个 具体 的 字 
母 A， 也 能 识别 印刷 体 的 、 手 与 体 的 、 方 癌 不 正 、 
大 小 不 同 的 各 种 字母 A。 这 就 提示 操作 者 ， 匹 配 过 
a a AARTE n 
JEE o 


3. 关键 概念 

下 面 介 绍 一 些 识 别 中 第 用 的 重要 概念 。 

(1) 模式 类 (Pattern Class) : 古 指 共 至 一 组 
共同 属性 〈 或 特征 ) 的 模 陈 集合 ， 通 单 具 有 相同 的 
来 源 。 

(2) FFE (Feature) : 是 一 种 模式 区 别 于 田 
一 种 模式 的 相应 CR FARE 
或 处 理 能 够 抽取 的 数据 。 


(3) RÆ (Noise) : 是 指 与 模式 处 理 〈 特 征 


ЇНДХ НН Н) Ж СЕК) VUIZRE AKSI KR, Е 
对 系统 的 分 类 能 力 〈 如 识 询 ) 产生 影 啊 。 


(4) 分 类 / 识 列 
( Classification/Recognition) : 是 指 根 据 特征 将 模 
式 分 配给 不 同 的 模式 类 ， 识 别 出 模 式 的 类 别 的 过 


Feo 


(5) 分 类 器 (Classifier) : 可 理解 为 为 了 实 
现 分 类 而 建立 起 来 的 条 种 计算 模型 ， 它 以 模式 特征 
为 输入 ， 输 出 该 模式 所 属 的 关 别 信息 。 

(6) 训练 样本 (Training Sample) : 2—62 
别 信 息 己 知 的 样本 ， 通 第 使 用 它们 来 训练 分 关 翰 。 

(7) 训练 集合 (Training Set) : 训练 样本 所 
组 成 的 集合 。 


(8) 训练 /学 习 CTraining/Learning) : 是 指 根 
据 训 练 样 本 集合 ,，“ 教 受 ” 识 列 系 统 如 何 将 输入 矢量 
映射 为 输出 天 量 的 过 程 。 

(9) 测试 样本 (Testing Sample) : 是 一 些 类 
列 信 息 对 于 分 类 右 未 知 ( 不 提供 给 分 类 右 其 类 列 信 
м) 的 样本 ， 通 第 使 用 它们 来 测试 分 类 豆 的 性 能 。 


(10) MARS (Testing Set) : 测试 样本 所 


组 成 的 集合 。 当 测试 集合 与 训练 集合 没有 交集 时 ， 
称 为 独立 的 测试 集 。 


(11) MA (Testing) : 是 将 测试 样本 作为 输 
入 迹 入 已 训练 好 的 分 类 种， 得 到 分 类 结果 开 对 分 类 
下 确 深 进行 统计 的 过 程 。 


(12) 191% (Accuracy) : 2384 T i F 
本 集合 而 言 ， 经 分 类 亏 识 齐 正 确 的 样本 占 总 样本 数 
的 比例 。 


(13) 泛 化 精度 (Generalization Accuracy) : 
ТЕЛА ЕА НЯ Е. ВӘЛ. 


А. ТАЖ] i Н) реА 


一 个 模式 识别 问题 一 般 可 描述 为 : 在 训练 样本 
集合 已 经 “ 教 受 ?给 识别 系统 如 何 将 输入 天 量 上 映射 为 
输出 天 量 的 前 提 下 ， 己 知 一 个 从 样本 模式 中 抽取 的 
WARMERS AMARE) ，X= {xX1,X2,...,Xn 
}， 桔 找 一 个 根据 预定 义 标准 与 输入 特征 匹配 的 相 
应 特性 集合 〈 和 输出 天 量 ) , Ү={у1,узә,...,Ут }< 


这 其 中 对 于 关 别 己 知 的 样本 参与 的 训练 过 程 ， 
可 参考 图 14.1〈a) ， 此 时 样本 的 类 别 信息 了 是 已 知 
的 ， 它 同 训练 样本 X 一 起 参与 分 类 冀 有 的 训练 而 图 


14.1 (b) "ЯЕ ЖН УЖ 1 2728483130 
入 模式 X ША] 5 29А Ly НЕ. EBRE, 
不 妨 将 训练 过 程 理解 为 一 神 在 输入 X 和 输出 了 均 已 
RURI TEDE ОХЕ РАУ = РОХ BAEAN KAME 
过 程 ， 而 识别 过 程 则 可 理解 为 将 类 别 未 知 的 模式 X 
作为 f 的 输入 ， 从 而 计算 出 了 的 函数 求 值 过 程 。 当 
然 ， 这 里 的 函数 f 很 可 能 不 有 具有 人 解析 形式 ， 有 了 时 会 
HARR, ERRE PS X EWER A 





(b) 识别 过 程 


414.1 ”训练 和 识 列 过 程 


在 第 13.1.3 小 节 中 讨论 特征 同 量 及 其 几何 解释 
时 ， 曾 指出 了 识别 《分 类 ) 的 任务 就 是 找到 对 特征 
空间 的 一 种 合理 划分 。 分 类 可 将 特征 空间 分 成 标记 
为 类 别 的 诀 策 区 域 ， 对 于 唯一 的 分 类 结果 ， 这 些 区 
域 必 须 窗 访 整 个 特征 空间 且 不 相交 ， 而 每 个 区 域 的 
边 绿 称 为 决策 边界 。 从 这 个 音义 上 说 分 类 楷 束 是 分 
制 决 策 区 域 的 雇 委 边界 阔 数 集合 ， 图 14.2 给 出 了 一 
些 典 型 内 决策 区 域 和 决 案 边界 。 对 特征 和 天 量 的 分 类 
束 是 确定 它 属于 那个 决 朱 区 域 的 过 程 。 


5. МЕ 
在 图 14.2 中 ， 可 以 注意 到 决策 边界 既 可 以 是 图 


14.2 (a) 、 图 14.2 (b) 中 那样 简单 的 线性 或 二 次 
形式 ， 也 可 以 像 图 14.2 (c) 中 的 那样 极其 复杂 且 不 


规则 形式 。 那 么 ， 对 于 一 个 特定 的 分 类 问题 ， 旋 者 
是 应 当选 择 简 单 的 模型 还 是 比较 复杂 的 模型 呢 ? 一 
般 来 说 ， 简 单 的 模型 具有 计算 复杂 上 度 上 的 优势 ， 训 
练 它们 所 需 的 样本 数 上 日 通常 也 更 少 ， 但 它们 对 空间 
的 划分 往往 不 够 精确 ， 导 致 识 询 精 上 度 党 到 一 定 的 限 
ШЇ; 而 复杂 的 模型 可 以 更 好 地 拟 合 训练 样本 ， 产 和 后 
非常 适应 训练 数据 的 复杂 诀 策 边界 ， 从 而 有 理由 期 
望 它 们 在 测试 集 上 也 会 有 好 的 表现 。 然 而 ， 这 一 美 
好 有 的 愿望 并 不 总 能 实现 ， 事 实 上 ， 过 反复 林 有 的 决 宁 
边界 第 党 导 任 所 请 “过 撒 拟 合 ”(Overfit〉 现象 的 发 
生 ， 正 如 例 14.1 中 所 搬 述 的 那样 。 


【 例 14.1】 过 上 度 拟 合 现 象 。 


对 于 图 14.3 (а) 中 的 两 类 训练 样本 ， 有 有 如 图 
14.3 (а) 所 示 的 两 种 分 类 宋 略 ， 一 个 人 简 时 的 二 炊 


曲线 和 万 一 个 复杂 得 多 的 不 规则 曲线 。 可 以 看 
到 在 图 14.3 (a) 中 不 规则 曲线 完美 地 分 基 了 所 有 的 
训练 样本 ， 无 一 到 蚀 ; 和 而 当面 对 从 未 见 过 的 出 试 样 
本 时 《如 图 14.3 b) Вт) ， 复 杂 曲 线 的 表现 令 人 
ХКУ, Е ХААРА 
Аах, у НИНА ТЕН А. 
RAJA, ЕЕЕ АКН ЯО ЎТ ДУВЕ М АЛТ 
数据 进行 很 好 地 与 纳 《〈 汉 化 ， 一 般 化 ) , ЕЛ 
倾 回 对 训练 数据 的 正确 划分 ( 复 末 的 形式 正好 为 它 


们 完美 地 拟 合 训练 数据 创造 了 条 件 ) ， 而 不 能 够 对 
真正 的 数据 模型 进行 很 好 地 分 类 。 这 个 问题 称 为 过 
EME (Overfit) 。 简 蛙 的 决 案 边界 对 训练 数据 不 
够 理想 ， 但 是 对 新 数据 却 往 往 能 够 较 好 地 归纳 。 


eee 


(а) 线性 的 决策 边界 (b) КИ (с) 更 为 复杂 的 决策 边界 
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训练 数据 测试 数据 





(a) 对 训练 样本 的 划分 (b) 对 测试 样本 的 划分 
图 14.3 ”过 度 拟 合 
6. 模式 识别 系统 结构 


本 市 最 后 ， 图 14.4 为 读者 展示 了 一 个 典型 的 模 
式 识 列 系统 的 结构 。 原 始 柑 式 自 完 经 过 预 处 理 (本 
书 的 3 一 12 革 讨论 的 部 是 图 像 预 处 理 的 方法 ) ; 而 
后 经 过 特征 提取 第 13 革 ) 得 a 到 适合 分 类 人 禹 处理 的 
特征 问 量 ， 此 过 程 中 有 时 也 包括 必要 的 降 维 处 理 ; 
最 后 分 类 此 输出 的 识 列 结 来 沼 第 偿 裔 要 后 处 理 ， 所 
谓 后 处 理 主要 指 根据 得 到 的 识 列 结 未 进行 评 佑 和 收 
进 ， 像 如 何 调整 分 基带 参数 以 防止 过 度 拟 合 等 。 


7. 训练 /学 习 方 法 分 类 
一 般 的 训练 /学 习 过 程 是 指 在 给 定 一 般 的 模型 


或 分 关 融 形 却 的 情况 下 ， 利 用 训练 伞 本 去 学 习 和 售 
计 模 型 的 未 知 参 数 ， 上 有 具体 地 说 束 是 用 某 种 算法 来 降 


低 训 练 样本 的 分 类 误差 。 比 如 在 第 15 音 人 工 神经 网 
络 中 将 要 学 习 的 樟 度 下 降 算 法 ， 它 通过 调和 分 类 需 
的 参数 ， 使 训练 级 独 能 够 降低 误差 的 方 癌 进行 。 还 
Куклин mina 
形式 。 


(1) 教师 指导 的 学 习 : 又 称 为 有 监督 学 习 。 
征 指 在 训练 样本 集中 的 每 个 输入 样本 闫 列 均 己 知 的 
情况 下 进行 学 习 ， 也 束 古 使 用 训练 模式 和 相应 的 关 
别 标记 一 起 来 教授 分 类 器。 日 沼 生 活 中 有 监督 学 习 
的 一 个 例子 是 教 护 子 识 子 ， 教 师 将 子 本 里 样本) 
和 具体 十 什么 子 (RI) 一 起 教 给 孩子 。 


(2) 无 教 帅 指导 的 学 习 义 称 为 无 监督 学 习 。 
尽 指 在 样本 中 没有 相应 的 类 别 信 筷 的 情况 下 ， 系 统 
对 输入 样本 目 动 形成 “ 目 然 的 ”组 织 或 禾 
(Cluster) 。 如 “ 聚 类 算法 ”就 古 一 种 典型 的 无 监督 
学 习 。 


(з) 加 强 学 习 义 称 为 基于 评价 的 和 学习。 在 加 
强 学 习 中 ， 并 不 把 类 别 信 息 直 接 提供 给 分 类 器 ， 而 
是 让 分 类 此 目 己 根据 输入 样本 计算 输出 类 别 ， 将 它 
与 已 知 的 类 别 标 记 进 行 比 较 ， 判 断 对 已 知 训 练 模式 
的 分 类 是 否 正 确 ， 从 而 辅助 分 类 器 的 学 习 。 日 常生 
活 中 加 强 学 习 的 一 个 例子 是 提供 正确 答案 的 考 试 讲 
评 ， 这 里 考生 束 相 当 于 分 类 右 ， 他 们 先是 独立 考试 


(分 类 ) ， 而 后 根据 教师 提供 的 标准 从 生来 改善 知 


RER (DRRR) o 


原始 模式 






калышын 识别 (分 类 ) 结果 


降 维 处 理 - 通 党 在 预 处 理 
和 特征 提取 中 完成 后 处 理 结 果 
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14.2 EARI TIATA 


A ЯЛ А НУ АЛАЛ ЛТ, BRRR 
(Statistical Pattern Recognition) 方法 和 句法 〈 结 
J) 模式 识别 (Syntactic Pattern Recognition) Ù 
法 。 统 计 柑 式 识 别 是 对 模式 的 统计 分 类 方法 ， 即 结 
合 统计 概 众 论 的 贝 叶 斯 决 菏 系统 进行 模式 识 列 的 技 
术 ， 叉 称 为 次 案 理 论 识 别 方 法 ;而 利用 模 陈 与 子 模 
式 分 层 结构 的 树 状 信息 所 完成 的 模式 识 询 工作 ， 吏 
征 句 法 《结构 ) 模式 识别 。 


1. 统计 模式 识别 


统计 模式 识别 的 基本 原理 是 : 有 相似 性 的 样本 
在 柑 式 空间 中 互相 接近 ， 并 形成 “集团 *"， 即 “ 物 以 
RR? o HIIT IT IAEN DERRI T E IRIE e EX 
= yn xig)! (i= 1,2,...,N ) ， 将 一 个 给 
定 的 模式 归 入 C 个 类 w р, w > ,..., we 中 ， 可 视 为 根据 
模式 之 则 的 条 种 距离 孙 数 来 判别 分 类 。 其 中 ，T 表 
EPE ы ала 


在 统计 模式 识别 中 ， 贝 叶 斯 决策 规则 从 理论 上 
解决 了 最 优 分 类 器 的 设计 问题 ， 但 其 实施 却 必须 首 
先 解 雇 更 困难 的 概 浴 密 撒 估计 问题 ，BP 神 经 网 络 和 且 
接 从 观测 数据 (训练 样本 ) 学 习 ， 是 更 简便 有 效 的 方 
法 ， 因 而 获得 了 广泛 的 应 用 ， 但 它 是 一 种 局 发 式 技 
术 ， 铅 乏 工 程 实 践 的 坚实 理论 基础 ， 统 计 推 断 理 论 
研究 所 取得 的 突破 性 成 果 导 致 现代 统计 和 学习 理 论 
VC 维 的 建立 ， 该 理论 不 仅 在 严格 的 数学 基础 
上 圆满 地 回答 了 人 工 神 经 网 络 中 出 现 的 理论 问题 ， 
而 且 导 出 了 一 种 新 的 学 习 方 法 一 一 支持 问 量 机 .。 


2. АЈ ЗЯ] 

ХМ ВН A ENA. АЕА a qI 
У О АЕ И НЕ fo ЈАН r, РЯ х 
п] RNE ERTIES, RAIA 
EAR, EIR H ре f НЕШ) TARAIRE 





一 一 个 


其 元 。 


在 句法 方法 中 选取 基 元 的 问题 相当 于 在 统计 方 
法 中 选取 特征 的 问题 。 通 和 要 求 所 选 的 基 元 能 对 模 
Jue ik eu БОБ H АЛЫ Я УНО, E 27 
于 用 非 句法 方法 加 以 抽取 。 显 然 ， 基 元 本 号 不 应 该 
含有 音 要 的 结构 信息 。 模 式 以 一 组 基 元 和 它们 的 组 
合 天 系 来 拍 述 ， 称 为 模式 手 述 语句 ， 这 相当 于 在 语 
言 中 ， 句 子 和 短语 用 词组 合 ， 词 用 字符 组 合 一 样 。 
基 元 组 合成 模式 的 规则 ， 由 所 谓 的 语法 来 指定 。 一 
日 基 元 被 徐 别 ， 识 列 过 程 可 退 过 句法 分 析 进 行 ， 妈 
分 析 给 定 的 模式 语句 是 任 从 合 指定 的 语法 ， 满 在 攻 
类 语法 的 即 被 分 入 该 类 。 可 以 说 句法 模式 识别 是 基 
于 对 结构 相似 性 的 调 量 来 分 类 模式 。 葬 方法 不 但 可 
以 用 于 分 类 ， 也 可 以 用 于 手 述 。 


【 例 14.2】 统计 方法 与 名 法 (结构 ) 方法 的 比 


E o 


图 14.5 给 出 了 对 于 光学 字符 识 列 COCR) 问 
虹 ， 统计 方法 与 结构 化 方法 在 解决 问题 上 的 不 同 思 
路 。 同 样 对 于 上 方 的 字母 “A”， 采 用 统计 方法 的 一 
种 可 能 做 法 是 : 选取 特征 为 字母 中 交叉 点 的 数目 ， 
左 、 石 短线 的 数目 ， 模 的 数目 以 及 孔洞 的 数目 ， 这 
样 字 母 “A” 僵 成 了 图 中 所 示 的 1 个 特征 问 量 
=B3 2 2 1 4" ， 如 概 座 分 布 已 知 ， 则 可 计算 出 似 


IRAP XA ， 从 而 构造 由 时 斯 分 类 器 ， 这 
一 过 程 反 映 在 图 14.5 的 中 则 分 文 上 ; 为 一 种 选择 是 
MELER, HRK S TEE A” MIJE XE 
所 有 像素 的 像素 值 (2 Н 57051, НЕТ 50, 
黑色 字母 为 1) 投行 或 按 列 存储 作为 特征 辐 量 ， 送 
给 训练 好 的 神经 网 络 进行 识别 ， 这 一 过 程 如 图 中 磊 
侧 分 文 所 示 。 而 当 采 用 句法 《结构 ) ЛЕН, F 
母 “A” 航 看 成 是 鲜 14.5 右 侧 分 文 所 示 的 一 些 子 结构 
CERD 的 组 合 ， 这 些 子 结构 有 各 目的 结构 和 方 同 
开 且 投 照 一 定 的 规则 组 合 在 一 起 ， 最 终 这 些 子 结 构 
连同 它们 之 则 的 规则 被 一 并 壕 解 析 器 (Parser) 进 
行 类 似 于 句法 分 析 的 处 理 从 而 识别 出 关 别 。 





| ku, s 
统计 方法 (神经 网 络 ) 统计 方法 〈 贝 叶 斯 ) 句法 (结构 ) 方法 


特征 所 取 : 


# 交 叉 点 数目 / N 
# 左 斜 线 数目 + 
# 右 斜 线 数目 vs > JOəl 
# 横 线 数目 ‚ 
# 孔 洞 数目 
| A 
x= 2 2 1 1] RRE x |“A”) 





P(fif |œ) / \ 
| Q 
N А ; 人 
f | 19 Ç № Д | 
+ l 1; 





0 
神经 网 络 也 可 与 特征 提取 结合 
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南 要 说 明 的 是 作为 一 个 例子 ， 图 14.5 元 侧 分 文 
中 癌 量 在 友人 神经 网 络 之 二 没有 经 过 特征 所 取 ， 这 只 
征 选 择 之 一 ， 在 实际 应 用 中 神经 网 络 的 输入 也 名 和 
征 经 过 特征 握 取 的 同 量 ， 同 样 突 似 于 X › 那样 经 过 物 
КЕЗ ЯХ НУ арза АЈ ВДЕ а НУЗИ) ЛА, ПО АМУ 
仪 是 贝 叶 斯 模型 。 


3. 小 结 


模式 识别 方法 的 选择 取决 于 问题 的 性 质 。 如 果 
做 识 列 的 对 象 极为 复 来 ， 而 且 包 含 丰富 的 结构 信 


娠 ， 一 般 米 用 人 句法 方法 ; 航 识别 对 象 不 很 复杂 或 不 
含 明显 的 结构 信息 ， 一 般 及 用 统计 方法 。 这 两 种 廊 
法 不 能 截然 分 开 ， 在 句法 方法 中 ， 基 元 本 号 融 征用 
统计 方法 抽取 的 。 在 应 用 中 ， 将 这 两 种 方法 结合 起 
来 分 列 施 加 于 不同 的 层次 ， 和 营 能 收 到 较 好 的 效 来 。 


本 书 并 不 是 一 本 专门 介绍 模式 识别 的 书籍 ， 后 
续 的 讨论 将 不 涉及 句法 模 坏 识 列 的 相关 内 容 ， 这 主 
要 是 出 于 对 本 书 内 容 完整 性 和 紧凑 性 的 考虑 《〈 人 句法 
模式 以 目 然 语 言 与 目 动机 为 其 理论 根基 ) ; 同时 本 
节 也 不 准备 从 经 典 的 由 叶 斯 分 类 理论 开始 ， 对 各 种 
统计 模式 识别 技术 一 一 讨论 ， 而 是 将 着 眼 于 目前 统 
计 模 式 识 别 领 域 中 十 分 活跃 、 和 图 像 识 别 关 系 密切 
并 用 已 在 工程 扩 术 领域 获得 广泛 应 用 的 两 种 非 溃 实 
用 的 分 类 器 技术 一 人工 神 经 网 络 〈 第 15 章 ) 和 文 
Еа (55162) 。 


14.3 NEE A NR Ar MERA Е АЕ 


WIWARA, AE A CAITER 
MARRIR A ERAR, ЯА] ЖЛЕ КЕЛЫН 
f KAXHJ Г ATR EMRET Ж 
BEADRA ЭРИ РУР 
BAA АЛ. АСНУ РАН Ж C K UL Br qx Ж. 








14.3.1 最 小 距离 分 类 着 及 有 其 MATLAB 实 
现 


1. 理论 基础 


最 小 距离 分 关 义 称 最 近邻 分 类 ， 古 一 种 非 铝 简 
单 的 分 闫 思想 。 这 种 基于 匹配 的 分 闫 技术 通过 以 一 
种 原型 模式 问 量 代表 每 一 个 类 刑 ， 识 列 时 一 个 未 知 
模式 被 赋予 一 个 按照 预先 定义 的 相似 性 度量 与 其 距 
离 最 近 的 类 别 ， 香 用 的 距离 度量 有 了 欧 氏 距离 、 与 氏 
中 离 等 。 下 面 以 欧 开 距离 为 例 讲 解 妈 小 距离 分 类 
fir o 


一 种 简单 的 做 法 是 把 每 个 兴 所 有 样本 的 平均 加 
аи 


(14-1) 


ЖЕЕ, АУМ 。 


当 需 要 对 一 个 未 知 模式 x 进行 分 类 时 ， 只 需 分 
别 计算 x 与 各 个 "(i=1,2,.…,W ) 的 距离 ， 然 后 将 


它 分 配给 距离 最 近 的 代表 同 量 所 代表 的 关 别 。 
对 于 欧 氏 距离 表示 的 x 与 各 个 m 的 距离 : 
Рдт) = |= —m;|| i=1,.2,::: , W 
(14-2) 


АН, |x-mil=((x-mi) (x-mi) “， 表 示 欧 
几 里 的 范 数 ， 即 向 量 的 模 。 

在 W 个 Di (x ) 中 找到 最 小 的 一 个 ， 不 妨 设 为 D; 
(x )， 则 x 属于 第 i 类。 下面 来 看 一 个 使 用 最 小 距离 
分 类 器 的 实例 ， 请 读者 思考 最 小 距离 分 类 器 具有 怎 
样 的 决策 边界 。 


2. MATLAB 实 现 


下 面 通 过 例 14.3 给 出 最 小 距离 分 基带 的 实现 方 


i. 
[114.31 ETRE ATRAS Fe Ja kE 37 
Л 


X E413 РДМАТТ,АВ Н r HJ > Jë JE PE J 2 Tia 7 
|, Н МХ [х ЭИА rH WJ FE Ж J 
于 哪 一 类 植物 。 数 据 集 共有 setosa、versicolor 和 


virginica 三 区 总 尾 属 植物 。 载 入 fisheriris 数 据 集 之 
后 ，meas 中 共 包 侣 了 150 个 植物 样本 ，meas 窍 阵 的 
每 一 行 是 代表 一 个 植物 样本 的 特征 同 量 ， 访 特征 同 
量 的 含义 可 参见 例 13.1; 而 细胞 数组 Species 中 包含 
了 对 应 看 150 个 样本 的 类 别 信 息 ， 从 中 可 见 前 50 个 
样本 为 第 1 类 ， 中 间 50 个 为 第 2 类 ， 后 50 个 属于 第 3 
类 。 实 验 中 利用 每 类 的 前 40 个 样本 生成 代表 该 类 的 
模板 ， 后 10 个 被 保留 至 一 个 独立 的 测试 集 ， 用 于 验 
证 最 小 距离 分 类 和 需 的 识别 率 。 


计算 每 个 测试 样本 与 3 类 模板 癌 量 最 小 距离 ， 
开 且 将 与 测试 样本 距离 最 近 的 模板 同 量 所 代表 的 关 
作为 测试 样本 的 类 标 写 的 天 人 键 代码 如 下 。 


for ii = 1:size(Test, 1) 

d(1) = norm(Test(ii, :) - m1); % 与 第 1 类 的 距离 
d(2) = norm(Test(ii, :) - m2); % 与 第 2 类 的 距离 
d(3) = norm(Test(ii, :) - m3); % 与 第 3 类 的 距离 


[minVal class(ii)] = min(d); % 计 算 最 小 距离 并 将 距离 样本 
ARKAA Н class 
епа 





АЈ в ХН 2772607728 3 jhi ЈЕЛА J >ë 
З ВИКА F, Pr 58 7612614 Н F 
的 “nearest.m2” 文 件 中 。 


% (114.3 利用 最 小 距离 分 类 需 分 类 3 种 总 尾 属 植 物 
load fisheriris % 载 入 Matlab 自 带 的 营 尾 属 植物 数据 集 


% 每 美的 前 46 个 样本 用 于 生成 代表 访 燃 的 模板 ， 后 16 个 作为 独立 的 测 
试 样 本 
ml = mean( meas(1:40, :) ); % 第 1 类 的 前 46 个 样本 的 平均 同 量 


m2 = mean( meas(51:90, :) ); % 第 2 类 的 前 46 个 样本 的 平均 同 量 
m3 = mean( meas(101:140, :) ); % 第 3 类 的 前 46 个 样本 的 平均 问 
量 


% 测试 样本 集 
Test = [meas(41:50, :); meas(91:100, :); meas(141:150, 


:)]; 

% MEERI MAKER 
classLabe1(1:10) = 1; 
classLabe1(11:20) = 2; 
classLabel(21:30) = 3 


3 


% 利用 最 小 距离 分 并 器 分 类 测试 样本 
class = zeros(1, 30); % 类 标签 
for ii = 1:size(Test, 1) 


d(1) = norm(Test(ii, :) - m1); %5% 1 类 的 距离 
d(2) = norm(Test(ii, :) - m2); %5% 2 类 的 距离 
d(3) = norm(Test(ii, :) - тз); %5% 3 类 的 距离 


[minVal class(ii)] = min(d); % 计 算 最 小 距离 并 将 距离 样 
本 最 短 的 类 赋 给 类 标签 数组 class 
end 


% 测试 最 小 距离 分 类 右 的 识别 这 

nErr = sum(class ~= classLabel); 
rate = 1 - nErr / length(class); 
strout = [RJ] K", num2str(rate)] 


运行 上 述 程序 ， 最 终 得 到 对 于 30 个 测试 样本 的 
识别 率 为 96.6667%。 可 以 看 到 ， 在 这 个 简单 的 3 类 
问题 上 ， 最 小 距离 分 类 需 取 得 了 不 钳 的 效果 。 


14.3.2 ”基于 相关 的 模板 匹配 
1. 理论 基础 

基于 相关 的 模板 匹配 扩 术 可 直接 用 于 在 一 幅 疼 
像 中 寻找 某 种 子 图 像 模式 。 回 顾 在 第 5 半空 间 域 图 
像 增强 中 ， 曾 经 介绍 了 图 像 相 关 的 基本 概 众 ， 对 于 


大 小 为 M хм ИВ (х, у ) 和 大 小 为 J xK 的 子 图 像 
模式 w (х,у), [Бу 的 相关 可 表示 为 : 


SUT = > У wis t) flirt s. + t) 
(14-3) 
ЖЕН, x=0,1,2,.... М-К,у=0,1,2,...‚ M-J 
这 一 计算 形式 与 式 (5-2) 稍 有 不 同 ， 此 处 的 
目的 是 寻找 匹配 而 不 是 对 fx ,y ) 进 行 滤波 操作 ， 


此 w 的 原点 航 议 症 在 子 图 像 的 堪 上 人 角 ， 并 且 陈 〈14- 
3) 给 出 的 形式 也 完全 适用 于 J 和 K 为 代数 的 情况 。 


计算 相关 c (x ,y) 的 过 程 束 是 在 图 像 f(x у) 
逐 点 地 移动 子 图 像 w (х, у), Ew 的 原点 和 点 (x у 
) 重 合 ， 然 后 计算 w 5f А += m ДЧ E PC ОЯ] yu 
ЈЕЛ САЛИ, РДЕ ТТТ ЛЕДЕ ЖАН Ж Fd c (х, 
y ) 在 (x ,yy ) 扩 的 啊 应 。 


相关 可 用 于 在 图 像 Fx ,y ) 中 找到 与 子 图 像 w (x 
,y 匹配 的 所 有 位 置 。 实 际 上 ， 当 w 按照 上 一 段 中 
描述 的 过 程 移 过 整 幅 图 像 /之 后 ， 最 大 的 响应 点 Go 
y 0 ) 即 为 最 佳 匹配 的 左上 角 点 。 也 可 以 设 定 一 个 立 
值 T， 认 为 响应 值 大 于 该 立 值 的 点 均 是 可 能 的 匹配 


位 置 


相关 的 计算 是 通 过 将 图 像 元 了 系 和 子 醒 式 图 像 元 
系 联 系 起 来 获得 的 ， 将 相关 元 妹 相 滋 后 素 加 。 完 全 
可 以 将 子 图 像 w 视 为 一 个 按 行 或 按 列 存储 的 同 量 5 
， 将 计算 过 程 中 航 w #8 mi BJ КЇЙ у о — 4" 12 
照 同 样 的 方式 存储 的 同 量 zs 。 这 样 一 来 ， 相 头 计算 
W У Паре |] Н а Ја я. 

两 个 同 量 的 后 积 为 : 

п eb = |а |0 cosg 


(14-4) 


有 其中，6 Ж ша, ç Z aj: Н. 


显然 ， 当 z 和 5 RAEI CEIT) 

ШЇ, со50=1, AMA (14-4) 取得 其 最 大 值 |a ||; |, 
Жой, К 24 ЧИНУ А ИХ ERKA F f BNR TEIN 

上 时， 相关 运算 产生 最 大 的 啊 应 。 然 而 ， 式 (14-4) 
最 终 的 取 值 还 与 回 量 zs 、5 目 身 的 模 有 关 ， 这 将 导致 
а 0 (14-4) 计算 的 相 天 啊 应 存在 看 对 f 和 w 的 灰 
度 幅 值 比较 敏感 的 缺陷 。 这 样 一 来 ， 在 f 的 高 灰 度 
区 域 ， 可 能 尽管 其 内 容 与 子 图 像 w 的 内 容 并 不 相 
这 ， 但 由 于 |z| 目 号 较 大 而 同样 产生 一 个 很 局 的 啊 
应 。 可 退 过 对 癌 量 以 其 模 值 来 归 一 化 从 而 解决 这 一 
问题 ， 即 通过 i 来 计算 相关 。 


改进 的 用 于 匹配 的 相关 计算 公式 如 下 : 


(14-5) 
改进 的 相关 公式 实际 上 计算 的 是 同 量 z、7 之 间 
的 光 角 余 弱 仁 。 显 然 ， 它 只 和 疼 唆 模式 本 映 的 形状 
或 纹理 有 天， 与 幅 值 〈 亮 上 度 ) 无 天 。 
2. MATLAB 实 现 


下 面 通过 例 14.4 给 出 基于 相关 的 模版 匹配 的 实 


现 方 法 。 
【 例 14.4】 基于 相关 的 图 像 匹 配 。 


414.6 (а) 中 黑色 青 景 的 图 像 中 包含 有 12 种 不 
BHRR, = EEFS14.6 (a) 中 找到 图 
14.6 (b) ЖЯ 14.6 (c) 中 的 子 图 像 的 最 佳 死 配 。 
414.6 (b) 中 的 图 像 对 应 看 图 14.6 (а) 中 第 2 行 的 
第 2 个 小 图 案 ， 但 整体 膨 及 较 其 在 图 14.6 (а) 中 更 
蜡 ， 而 图 14.6(c) 中 的 图 像 则 与 图 14.6 Са) "3 
行 的 第 2 个 小 图 案 相 似 ， 上 略 有 区 别 。 


А Ap 28:5) / imcorr( pq Е ИЛАН, (KAN 
ПК. 


function Ісогг = imcorr(I, м) 

% function corr = imcorr(I, м, ) 

% 计算 图 像 I 与 子 模式 w 的 相关 响应 ， 并 提示 最 大 的 啊 应 位 置 
X 

% Input: I - 原始 图 像 

% w - 子 图 像 

X 

% Output: Ісогг - 啊 应 图 像 


[m, n] = size(I); 
[те, пе] = size(w); 


Icorr = zeros(m-m0+1, n-n0+1); % 为 响应 图 像 分 配 空间 


vecW = double( w(:) ); % 按 列 存 储 为 向 量 


normW = norm(vecW); 20 @ M Гер а IJ Pa 





(a) 原 图 像 (b) 子 图 像 1 (c) 子 图 像 2 





(d) FR b) 在 图 (a) 中 的 匹配 (e) FER Сс) ÆR Са) 中 的 匹配 
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for ii = 1:m-mo+1l 


for jj = 1:n-no+1 
subMat = I(ii:ii+m0-1, jj:jj+n0-1); 
мес = double( subMat(:) ); % 按 列 存储 为 癌 量 
Icorr(ii, JJ) = vec' * vecW / (norm(vec)*no 
rmW+eps); % 计 算 当 前 位 置 的 相关 
end 
end 


% 找到 最 大 啊 应 位 置 
[iMaxRes, jMaxRes] = find(Icorr == max( Icorr(:) ) ); 
figure, imshow(I); 
hold on 
for ii = 1:length(iMaxRes) 
plot(jMaxRes(ii), iMaxRes(ii), '*'); % 绘 制 妈 大 啊 应 


% НЕЛЕ IE R DL Ас р Б 

plot([jMaxRes(ii), jMaxRes(ii)+n@0-1], [iMaxRes(ii) 
‚ iMaxRes(ii)] ); 

plot([jMaxRes(ii)+n@0-1, jMaxRes(ii)+n@0-1], [iMaxRe 
s(ii), iMaxRes(ii)+m0-1] ); 

plot([jMaxRes(ii), jMaxRes(ii)+n@0-1], [iMaxRes(ii) 
+m0-1, iMaxRes(ii)+m0-1] ); 

plot([jMaxRes(ii), jMaxRes(ii)], [iMaxRes(ii), iMa 
xRes(ii)+m0-1] ); 
end 


imcorr0 范 数 中 根据 相关 啊 应 的 结果 ， 分 别 将 
对 图 14.6 (b) Ж 14.6 (с) 响应 的 最 大 值 用 “*” 号 
标记 在 图 14.6 (d) 和 图 14.6 (е) F, HEREA 
出 了 相应 的 匹配 区 域 。 该 函数 的 调用 方式 如 下 。 





>> I = imread('patterns.bmp'); 
= imread('patl.bmp'); 

>> I2 = imread('pat2.bmp'); 

>> J1 = imcorr(I, I1); 

>> мах(31(:)) 


1.0000 


>> J2 = imcorr(I, 12); 
>> мах(32(:)) 


ans = 


0.9784 





上 述 程序 运行 后 对 图 14.6 (b) ~ 14.6 (c) 
子 图 像 的 匹配 结果 如 图 14.6 (d) . 14.6 (е) 所 
示 。 可 以 发 现 ， 两 次 匹配 都 只 找到 了 一 个 最 大 值 ， 
由 于 图 14.6 (а) 中 包 侣 了 与 图 14.6 (b) 中 子 图 像 
纹理 结构 完全 相同 的 图 像 区 域 ， 只 是 整体 明暗 不 
司 ， 因 此 相关 啊 应 中 最 大 从 max(J1(:)) = 1; 而 与 图 
14.6 (c) 的 相关 啊 应 最 大 值 为 0.9784， 这 也 正 讽 明 
J 14.6 (c) 中 子 图 像 模式 与 图 14.6 (а) 中 的 最 
佳 匹配 区 工 并 不 完全 相同 。 


3. Visual C++ 实现 


利用 Visual C++ 实现 模板 匹配 的 相关 代码 如 
Pa 





ОИНИ t SSS 


void CImage: :TemplateMatch(CImage* pTo, CImage* pTempla 


) 
功能 : 基于 相关 的 模板 匹配 
参数 : CImage* pTo: 目标 图 像 的 CImage 指针 


CImage* pTemplate: 子 图 像 的 CImage 指针 
返回 值 : 无 
i 0 
void СІтаре: :TemplateMatch(CImage* pTo, CImage* pTempla 
te) 
{ 
// 循 环 变 量 


int i, j, m, n; 


double dSumT; // с ЁЛ ЖП 
double dSumS; // 图 像 子 区 域 元 又 的 平方 和 
double dSumST; // 图 像 子 区 域 和 模板 的 点 积 
double R; // 啊 应 值 

double MaxR; // 记 录 当 前 的 最 大 啊 应 


// 最 大 啊 应 出 现 位 置 
int nMaxX; 
int nMaxY; 


int nHeight = GetHeight(); 

int nWidth = GetWidthPixel(); 

/ ГА Н Ут, Ж 

int nTplHeight = pTemplate->GetHeight(); 
int nTplWidth = pTemplate->GetWidthPixel(); 


// 计 算 dSumT 
dSumT = 0; 
for (m = @;m < nTplHeight ;m++) 
{ 
for(n = Ө; п < nTplWidth ;n++) 
{ 
// 模板 图 像 第 m 行 ， 第 n 个 像素 的 灰 度 值 
int nGray = pTemplate->GetGray(n, m); 


dSumT += (double)nGray*nGray; 


) 


ГЕЈЕ в ЛУ НУН ИУ. А. 
МахК = Ө; 
for (i = 0;i < nHeight - nTplHeight +1 ;i++) 
l 
for(j = 0;j < nWidth - nTplWidth + 1;ј++) 


dSumST = Ө; 
dSumS = Ө; 


for (m = @;m < nTplHeight ;m++) 
l 
for(n = @;n < nTplWidth ;n++) 


l 
// 原 图 像 第 itm 行 ， 第 jt+n 列 像 系 的 灰 度 值 


int nGraySrc = GetGray(j+n, i+m); 


// 模板 图 像 第 m 行 ， 第 n 个 像素 的 灰 度 值 
int nGrayTpl = pTemplate->GetGray(n, m); 


dSumS += (double)nGraySrc*nGraySrc; 
dSumST += (double)nGraySrc*nGrayTpl; 


) 


R = dSumST / ( sqrt(dSumS)*sqrt(dSumT));//+iF 
相关 啊 应 


// 与 最 大 相似 性 比较 

if (R > MaXR ) 

{ 
MaxR = R; 
nMaxX = j; 
nMaxY r: 


) 
} 


pTo->InitPixels(255); // 清 空 目 标 图 像 
// 将 找到 的 最 佳 匹 配 区 域 复制 到 目标 图 像 
for (m = @;m < nTplHeight ;m++) 


for(n = @;n < nTplWidth ;n++) 
{ 
int nGray = pTemplate->GetGray(n, m); 
pTo->SetPixel(nMaxX+n, nMaxY+m, RGB(nGray, nG 
ray, nGray)); 


} 


本 书 在 视 类 CDIPDemoView 中 编写 了 处 理 函 数 
OnRecTemplate(O) 用 来 测试 模板 匹配 芒 能 。 充 图 数 首 
先 弹 出 打开 文件 对 话 框 ， 要 求 用 户 选 择 模板 图 像 ， 
而 后 调用 Template0 函 数 与 输入 图 像 imgInput 进 行 罗 
配 。 其 完整 实现 如 下 。 





void CDIPDemoView::OnRecTemplate() 
{ АЙЕ 


// 获得 文档 类 指针 
CDIPDemoDoc* pDoc = GetDocument(); 


CImgProcess imgInput = pDoc->m Image; // 输入 对 象 


// ЗАНЕ ЖЕЕ 


if (imgInput.m pBMIH->biBitCount!=8) 


AfxMessageBox( "^ Æ8-bppK E 1%, JKA! "); 
return; 


) 


CImgProcess imgOutput = imgInput; // 输出 的 临时 对 象 
CImgProcess TplImage; // 模 板 图 像 


// 强 出 对 话 框 让 用 户 选 择 模板 图 像 
CFileDialog dlg(TRUE,"bmp","*.bmp"); 
if(dlg.DoModal() == IDOK) 


l 
CString strPathName; 
strPathName = dlg.GetPathName(); 
TplImage.AttachFromFile(strPathName); // 斌 入 模 
J КОЖ 
J 
else 


return; 


int nHeight = imgInput.GetHeight(); // 输 入 图 像 高 度 
int nWidth = imgInput.GetWidthPixel(); //% A| Dr 


J 

int nTplHeight = TplImage.GetHeight(); // 1 
度 

int nTplwidth = TplImage.GetWidthPixel(); // 模 板 图 像 
宽度 


if(nTplHeight > nHeight || nTplWidth > nWidth ) 


// ЛАР 

МеѕѕавеВох ( "#1 №71 ЕЕ ЛУ! ", "系统 提示 " 
, MB_ICONINFORMATION | МВ OK); 

return; 


) 


// 更 改 光 标 形 状 

BeginWaitCursor(); 

// 进行 模板 匹配 
imgInput.TemplateMatch(&imgOutput, &TplImage); 
// 将 结果 返回 给 文档 类 

pDoc->m Image = imgOutput; 


pDoc->SetModifiedFlag(true); 
pDoc->UpdateAllViews(NULL); 


// 恢复 光标 形状 
EndWaitCursor(); 


IA Н] ERR ИИ DIPDemot Н] #1 
ZARIE Е АОС Р. 


RAL BIB pri | Е 1—6 y ШЕМЕ 
CER) 不 变 的 相关 匹配 算 了 于， 但 祖 关 计算 仍然 对 
ЛГАР АЕТ ОК, ж Им 与 图 像 f 
中 对 应 的 相似 目标 大小 不 同 ， 则 一 般 来 说 很 难得 到 
满意 的 匹配 结 未 ， 为 了 解决 这 一 问题 ， 有 时 需要 采 
АЖА КИЯ], 计算 相关 ， 在 各 个 分 
并 率 下 寻找 可 能 的 匹配 位 置 ， 这 在 计算 量 上 的 需求 
可 想 而 知 ， 因 而 很 难 在 实际 系统 中 使 用 。 类 似 地 ， 
如 下放 转变 化 的 性 质 是 未 知 的 ， 则 寻找 最 佳 思 配 整 


要 求 对 w 进行 全 方位 的 旋转 。 更 多 的 时 候 ， 需 要 利 
用 对 问题 的 先 验 知识 得 到 有 天 尺寸 和 讶 转变 换 方 式 
的 一 些 线 系 ， 从 而 可 以 便 助 几何 变换 中 的 一 些 拉 术 
在 罗 配 之 前 对 这 些 变 换 进 行 归 一 化 处 理 。 


14.3.3 ”相关 匹配 的 计算 效率 


一 般 子 图 像 模 式 w 总 征 比 图 像 「 要 小 得 多 。 尽 
官 如 此 ， 际 非 w 非常 小 ， 合 则 例 14.4 中 采用 的 空间 
相关 算法 的 计算 量 虱 会 比较 入 ， 以 全 于 已 赴 要 依 徘 
使 件 来 实现 。 


一 种 所 升 计算 效 京 的 方法 十 在 频 域 中 实现 相 
大， 回忆 第 6 草 中 曾 学 习 过 的 和 耸 积 定理 ， 它 为 操作 
PEM S THERMAL RRR. R 
ДАБ, ELAK E E nj Р E AKR P 28k ale R 
RER., HREP E SAARA E AHR n] 
DA HH УБА ЖУЛ НАП ЛЕЙ [н] F — БА ЖУЛ E 
ДЕЛЕ УЛП) Е E НАР], A 
TREAS, 8]. 


Fl y) o tp[ T. y) => Fiu vH (u,v) 


(14-6) 


fiz, yw*r y) < Fiu, v) o Hiu, v) 


(14-7) 
Жн, "УЛАН, “*” JS JES 


下 面 给 出 了 按照 上 述 思路 在 频 域 下 实现 相关 ， 
再 和 变换 回 容 域 得 到 啊 应 图 像 IcorrH]JMATLAB 实 现 。 
程序 在 原 图 像 I 中 标记 出 了 匹配 位 置 。 


function Icorr = dftcorr(I, w) 
% function Icorr = dftcorr(I, w) 


% 在 频 域 下 计算 图 像 I STRA w HJH SH, JFE АСАУ DZ 


Input: I - 原始 图 像 
м - Ё 


H X X < < N HH 


Output: Icorr - 响应 图 像 
= double(1); 

[m n] = size(1I); 

[mð пе] = size(w); 

F = fft2(I); 

w = conj(fft2(w, m, n)); %w ВНЕ 
Ffilt = = w .* F; А R 

Icorr = real(ifft2(Ffilt)); % 反 变换 回 空 域 


% 找到 最 啊 相 应 位 置 


[iMaxRes, jMaxRes] = find(Icorr == max( Icorr(:) ) ); 
figure, imshow(I, []); 
hold on 


for ii = 1:length(iMaxRes) 
plot(jMaxRes(ii), iMaxRes(ii), 'w*'); 


plot([ jMaxRes(ii), jMaxRes(ii)+n@0-1], [iMaxRes(ii 
), iMaxRes(ii)], 'w-' ); 


plot el MaxRes(il)rn@- 1,jMaxRes(ii)+n0-1],[iMaxRes 
(ii),iMaxRes(ii)+m0-1],'w- 

plot([jMaxRes(ii), ]махКев (11 )+пё- 1],[iMaxRes(ii)+ 
те-1,іМахКеѕ(іі)+те-1], 'м-' ); 

plori [JMäxRes( ii); jMaxRes(ii)],[iMaxRes(ii),iMaxR 
es(ii)+m0-1],'w-' ); 
end 





对 于 例 14.4 中 的 模板 匹配 问题 ， 和 imcorr 相 
比 ，dftcorr 在 执行 效率 上 的 优势 是 显而易见 的 。 这 
是 因为 访问 题 中 模板 图 像 的 大 小 为 61x64， 虽 然 比 
原 图 像 小 得 多 ， 但 已 可 以 说 是 一 个 比较 大 的 模板 
了 。 有 文献 (Campbell 1969) 曾 指 出 ， 如 果 w 中 的 
非 零 元 素数 目 小 与 132〈 大 约 13x13 见 方 ) ， 则 直接 
在 空域 中 计算 相关 较为 划算 ， 含 则 通过 上 述 方法 弯 
换 至 频 域 下 计算 更 为 合适 。 当 然 ， 这 个 数目 不 是 绝 
对 的 ， 它 还 与 1 的 大 小 以 及 运 J PE Les АКЫ Н Ж, z 
者 可 以 把 它 作 为 参考 ， 来 决定 在 应 用 系统 中 实现 相 
关 的 具体 方式 。 


第 15 章 ”人工 神 经 网 络 

在 对 图 像 识 别 有 一 个 整体 认识 之 后 ， 从 现在 开 
台 要 尝 习 3 种 高 实用 性 的 分 类 技术 ， 本 章 介 绍 人 工 
神经 网 络 ， 第 16 章 和 第 17 章 将 分 别 围绕 支持 向 量 机 
和 AdaBoost 展 开 讨 论 ， 对 它们 的 理论 基础 将 给 出 必 
要 的 介绍 ， 重 点 放 在 两 者 在 应 用 和 实现 层面 的 一 些 
技巧 和 注意 事项 ， 学 习 的 目的 是 使 读者 在 学 习 之 后 
并 即 可 以 在 工程 实践 中 获 益 。 
本 章 的 知识 和 技术 热点 

(1) ANN 的 基本 结构 

(2) НИ 

(3) ANN 的 训练 和 使 用 技巧 
本 章 的 典型 案例 分 析 


基于 ANN 的 数字 字符 识 询 系统 


15.1 人工 神经 网 络 人 简介 


人 工 神 经 网 络 (Artificial Neural Networks, 


ANN) 也 简称 为 神经 网 络 (NN) ， 是 对 人 脑 或 生 
物 神 经 网 络 (Natural Neural Network) E FRAI 
性 的 抽象 和 模拟 。 它 为 从 样本 中 学 习 值 为 实数 、 离 
散 值 或 回 量 的 函数 提供 了 一 种 健壮 性 很 强 的 解决 方 
有 宁 ， 己 经 在 诸如 汽车 目 动 芍 驶 、 光 学 字符 识别 
кес 和 人 脸 识 别 等 很 多 实际 问题 中 取得 了 惊人 
УБЛ. 


РАЈ, APH HEE >J Ot E 
РА ХА (х), ARAA у ВИН СЭ) 或 者 
器 量 (经 过 编码 的 类 标签 ) ，ANN 目 然 能 够 胜任 这 
一 任务 ; 此 外 ， 由 于 可 学 习 实 值 疯 数 ，ANN 也 十 消 
数 拟 合 的 利 融 。 本 书 中 对 于 ANN 的 介绍 只 限于 分 类 
问题 ， 将 涉及 输出 为 离 敌 值 和 问 量 的 情况 。 


15.1.1 仿生 学 动机 
1. 生物 神经 网 络 


从 所 周知， 生物 大 脑 由 大 量 的 神经 细胞 〈 神 经 
元 Neuron) 组 成 ， 这 些 神经 元 相互 连接 成 十 分 复 
末 的 网 络 。 每 个 神经 元 由 3 部 分 组 成 : 树 突 、 细 胞 
体 和 轴 突 ， 如 图 15.1 所 示 。 树 突 是 树 状 的 神经 纤维 
接受 网 络 ， 它 将 输入 的 电信 号 传递 给 细胞 体 ， 轴 突 
是 里 根 长 纤维 ， 它 把 细胞 体 的 输出 信号 导 同 其 他 神 
经 元 。 关 量 这 样 的 神经 元 广泛 地 连接 从 而 形成 了 网 


络 。 神 经 元 的 数目 、 排 列 拓扑 结构 以 及 突 触 的 连接 
温度 决定 了 生物 神经 网 络 的 功能 。 





图 15.1 生物 神经 元 及 其 连接 方式 


钊 经 元 之 间 利 用 电化 学 过 程 传 递 信号 。 一 个 神 
经 元 的 输入 信号 来 目 万 一 些 神经 元 的 输出 ， 这 些 神 
经 元 的 轴 突 末梢 与 设 神 经 元 树 突 相 表 形成 突 触 。 大 
脑 神经 元 有 了 两 种 状态 : 兴 否 和 抑制 。 细 胞 体 对 这 些 
输入 信 写 进行 整合 并 进行 阐 值 处 理 。 如 来 整合 后 的 
刺激 信 超 过 茶 一 国 什 ， 神 经 元 被 激活 而 进入 兴 香 状 
态 ， 此 时 束 会 有 一 个 电信 号 退 过 轴 突 传递 给 其 他 神 
经 元 ; 合 则 神经 元 吏 处 于 抑制 状态 。 


生物 大 脑 具 有 超 强 的 学 习 能 力 。 相 天 人 研究 表 
明 ， 如 下 一 个 和 神经 元 在 一 段 时 间 内 频 莹 受到 激励 ， 
则 它 与 连接 至 输入 的 神经 元 之 间 的 连接 踢 度 融会 相 
应 地 改变 ， 从 而 使 得 该 神经 元 细胞 再 次 党 到 激励 时 
更 易 兴 否 ; H, ARE ЇН] Ру ЙУ ДОН 2 
ло НА A PE а io ie i pek. AX R U, HH 2 
Ju [JJ А ehh Н] ZH JE CIZE) -o 


一 个 训练 生物 神经 网 络 的 例子 如 人 类 和 学习 下 
棋 。 起 初 在 没有 接受 过 任何 下 棋 训 练 时 ， 可 以 理解 
为 大 脑 神经 元 网 络 处 于 一 个 随机 状态 ， 对 于 未 一 个 
棋局 (输入) ， 产 生 一 个 随机 的 应 对 案 略 (网 络 的 
实际 输出 ); 接 下 来 ， 这 一 应 对 荣 略 会 从 指导 教师 
( 教 下 横 的 人 或 者 和 是 一 本 棋 谐 ) 那里 得 到 相应 的 反 
馈 ( 这 一 步 下 得 好 还 是 不 好 ， 或 者 正确 的 走 法 十 什 
么 ， 相 当 于 训练 样本 的 目标 输出 ) ， 并 以 此 反馈 作 
为 调整 网 络 神 经 元 之 间 连 接 (这 些 连 接 上 其 有 可 训 练 
性 ) 的 依据 ; 随 看 这 种 训练 和 调整 过 程 的 进行 ， 网 
络 对 于 新 的 棋局 输入 〉 的 决 人 越 来 越 接 近 于 最 优 
决策 (实际 输出 更 加 接近 于 目标 输出 ) ， 网 络 处 于 
一 种 善于 对 东 个 棋局 做 出 正确 反映 的 状态 。 这 束 厦 
我 们 在 竺 习 下 棋 时 从 一 个 初学 者 到 局 手 的 过 程 。 


2. 人 工 神 经 网 络 
人 工 神 经 网 络 (ANN， 以 下 简称 网 络 或 神经 网 


络 ) 的 研究 在 相当 程度 上 受到 了 生物 大 脑 的 仿生 学 
司 友 ， 它 由 一 系列 简 早 的 人 工 神 经 元 相互 密集 连接 
构成 ， 其 中 每 个 神经 元 同样 由 3 部 分 组 成 : 输入 、 
人 工 神 经 细胞 体 和 输出 。 每 个 神经 元 具有 一 定数 量 
的 实数 值 输入 ， 并 产生 一 个 实数 值 的 输出 ， 如 良 
15.2375. 





输入 ө 输出 


人 工 神经 细胞 





415.2 ”人工 神经 元 示意 图 


一 个 人 工 神 经 元 的 输入 信号 来 日 男 一 些 神经 元 
的 输出 ， 其 输出 又 可 以 作为 男 一 些 神 经 元 的 输入 。 
一 种 称 为 感知 器 〈 见 15.2.1 小 节 ) 的 人 工 神经 元 同 
样 具 有 2 种 状态 : 1 和 -1。 人 工 神经 细胞 对 这 些 输入 
信号 进行 整合 并 进行 国 值 处 理 。 如 果 整 合 后 的 刺激 
值 超过 霖 一 国 值 神 经 元 被 激 活 而 进入 1 状态 ;， 含 则 
神经 元 束 处 于 -1 状态 。 


正如 大 脑 可 以 通过 不 断 调节 神经 元 之 间 的 连接 
而 达到 不 断 笠 习 进 步 的 目的 。ANN 也 可 以 通过 不 断 
调整 输入 连接 上 的 权 值 以 使 得 网 络 更 加 适应 训练 集 


SS 
Г] o 


在 ANN 的 训练 过 程 中 ， 训 练 样本 特征 同 星 古 


ANN 的 输入 ， 训 练 样 本 的 目标 输出 (在 分 类 问题 中 
HRPE R) 是 网 络 的 输出 。 初 始 情 况 下 ， 网 络 权 
值 被 切 始 化 为 一 种 随机 状态 ， 当 把 某 个 训练 样本 输 
入 网 络 时 ， 由 此 产生 的 网 络 输出 与 训练 样本 目标 输 
出 之 间 的 差异 称 为 训练 误 兰 ;， 接 下 来 ，ANN 将 根据 
某 种 机 制 〈 参 见 15.2.1 小 节 ) 调节 权 值 w ， 使 得 训 

练 误差 逐步 减 小 ; 随 着 这 种 训练 和 调整 过 程 的 进 

Ee 
目标 输出 。 


人 人工 神经 网 络 和 生物 神经 网 络 机 能 的 类 比如 表 
15.1 所 示 。 


表 15.1 人 工 神经 网 络 与 生物 神经 网 络 机 能 艾 比 


人 工 神 经 网 络 (ANN) 生物 神经 网 络 
| 


大 脑 的 学 习 
生物 神经 细胞 之 间 连 接 的 调节 





ANN 对 于 特定 输入 样本 的 输出 大 脑 对 于 特定 输入 情况 的 决 集 





15.1.2 人工 神经 网 络 的 应 用 实例 


在 准备 稍 显 枯燥 的 ANN 理 论 学 习 之 前 ， 先 来 看 
一 个 将 ANN 应 用 于 学 习 汽 车 日 动 芍 驶 的 典型 案例 ， 
J WANNB6 Z HERATA FE HJ Н] ЗЕЛА rH 3 Е HJ 
对 于 ANN 的 感性 认识 。 


【 例 15.1】 ALVINN 汽 车 自动 驾驶 系统 。 


著名 的 自动 驾驶 系统 ALVINN 是 ANN 一 个 典型 
的 应 用 。 该 系统 使 用 一 个 经 过 训练 的 ANN 以 正常 速 
皮 在 局 速 公 路 上 如 驶 汽车 。 如 图 15.3 СЬ) Вт, 
ALVINN 具 有 一 个 典型 的 3 层 结构 ， 网 络 的 输入 层 
共有 30x32 个 单元 ， 对 应 于 一 个 30x32 像 素 点 阵 ， 是 
由 一 个 安装 过 在 车 辆 上 的 前 同 摄 像 机 获取 的 图 像 经 过 
重 采 样 得 到 的 。 输 出 层 共 有 30 个 单元， 输出 情况 指 
出 了 和 芋 辆 行进 的 方 同 。 


最 大 幅度 左 转 直行 最 大 幅度 右 转 


输入 层 
30x32 的 摄像 


头 捕获 图 像 的 
重 采样 数据 





| а КЕЛЕР»... 
(a) 车 内 的 摄像 头 和 前 方 的 实际 情况 (b) ALVINN 的 网 络 结构 


415.3 ”学 习 汽 车 日 动 驾 驶 的 ALVINN 系 统 


Е: 摄像 头 捕获 图 像 的 30x32 的 重 采 样 图 像 被 
作为 网 络 的 输入 ， 对 应 于 960 个 输入 层 单 元 ， 这 些 
输入 又 连接 至 4 个 隐 颖 单元 ， 再 连接 到 30 个 输出 单 
元 ， 输 出 为 一 个 30 维 同 量 ， 相 当 于 把 整个 方 同 熏 的 
控制 范围 分 成 30 份 ， 每 个 输出 单元 对 应 一 个 特定 的 
A 
驶 方 同 。 


在 训练 阶段 ，ALVINN 以 人 类 当 驶 时 摄像 机 所 
捕获 的 前 方 交 通 状况 作为 输入 ， 以 人 类 通过 操作 方 
回 熏 给 出 的 前 进 方 辐 作为 目标 输出 ， 整 个 训练 过 程 





X2J5min; 在 测试 阶段 ，ALVINN 用 学 习 到 的 网 络 
在 高 速 公 路 上 以 70 英 里 的 时 速成 功 地 苔 怠 了 90 英 
里 。 


在 ALVINN 中 所 有 单元 分 层 互 连 形成 了 一 个 有 
加 无 环 狗 ， 相 邻 层 之 间 是 全 过 接 的 ， 这 是 很 多 ANN 
的 典型 结构 。ANN 结 构 还 可 有 多 种 其 他 类 型 ， 本 章 
只 集中 介绍 具有 类 似 于 ALVINN 的 网 络 结构 并 以 反 
器 传播 (Back Propagation, BP) 算法 为 基础 的 最 
种 见 和 实用 的 ANN。 


15.2 ”人工 神经 网 络 的 理论 基础 


在 进入 用 于 ANN 训 练 的 反问 传播 算法 的 学 习 之 
前 ， 首 多 了 解 用 于 训练 线性 单元 的 们 度 下 降 法 十 非 
单 有 三 的， 它 构 成 了 有 反问 传播 算法 的 基础 。 不 同 的 
征 榜 度 下 降 法 只 古训 练 一 个 线性 单元 ， 而 反问 传播 
算法 能 够 训练 多 个 单元 的 互连网 络 。 因 此 将 从 感知 
级 开 始 ， 进 而 介绍 训练 线性 里 元 的 标 上 度 下 降 算 法 ， 
最 终 推 广 到 用 于 神经 网 络 训练 的 反 同 传播 算法 。 


15.2.1 训练 线性 单元 的 梯度 下 降 算 法 


1. 15 СРегсерігоп ) 


МЕШ ат ле Н ЖН Р НЇН ВЕУ ÀN L Al 
经 元 ， 一 个 其 有 n 个 实数 输入 x 1 ,xX 2 .xn НУЛА 
如 图 15.4 所 示 。 每 个 输入 x 对 应 一 个 权 值 w; ， 此 外 
还 有 一 个 偏 置 (BIAS) 项 wo ， 首 先 需 计算 这 n 个 
输入 根据 其 权 值 形成 的 一 个 线性 组 合 再 加 上 偏 置 
ДД уу 0 ， МЇ); 





Wo 
W2 > g Ku 
И 
| | W; X; 


Ий j=0 





图 15.4 ”感知 器 单元 


П 


net = у Ша Ti T Шү) 


i=l 


(15-1) 


不 妨 令 x =1, MATR (15-1) 可 表示 为 : 


П 


net = у t- Z; — Ü - T. 


1 一 用 


(15-2) 


其 中 HA H EF = (1. а nays , Zn) ° ДХ. [6] ж 


ш! = (шо. М7]. Ы, . шп) о 


感知 器 的 输出 为 式 〈15-2) AIREAK 


ZIR 


= 


F: 
L > w,x > 0 


-1. Я 


вн. 


(15-3) 


KRIAS НУ LIED A EAI a E. ло ДУАНА o 
ТЕ Е 8115.4rH Ж ЛУ ERKA E ло НАЈ E 
的 权 值 wi 表示 在 对 输入 的 线性 组 合 中 各 个 xi 的 页 献 
大 小 ，2 单 元 的 加 权 求 和 处 理 即 为 对 输入 的 人 整合 过 
柱 。 而 感知 硕 的 1 和 -1 两 种 输出 对 应 于 生物 神经 元 
的 兴 否 和 抑制 两 种 状态 。 


由 式 (15-3) 的 形式 可 知 ， 感 知 妖 对 应 于 一 
An 维 空间 中 的 超 平面 a.z = 0， 它 能 够 分 类 两 类 样 
本 。 对 于 其 一 侧 的 输入 样本 输出 1; 对 于 男 一 侧 的 
样本 输出 -1。 训练 过 程 束 是 调 整 权 值 w 13W 2 ,...,Мр ° 
BE a Nl АУ Р 2 А ЭЛН +14-1. 


2. 线性 单元 (Linear Unit) 


只 有 1 和 -1 两 种 输出 限制 了 感知 硕 的 处 理 和 分 
类 能 力 ， 一 种 简单 的 推广 是 线性 单元 ， 即 不 市 国 值 
НЛ. А.А п 个 输入 x1,X2 .xn 的 线性 年 
元 如 图 15.5 所 示 ， 其 输出 为 其 n 个 输入 根据 其 权 值 
形成 的 一 个 线性 组 合 再 加 上 偏 置 项 w o, B: 


X |] 





Х| Wi 
Wo 
Х2 К 
Wn 
Xn 





415.5 ”线性 单元 示意 图 


П 


CHE) = PB UU; ` Ti + Шр 


i=] 


(15-4) 


令 x0 =1， 从 而 式 〈15-4) 可 表示 为 : 


П 


СҢ) = у и ` T; = U ` T 


1—0) 


(15-5) 


其 中 ， 输入 回 量 z= (1, zi,zə,: = ° ДХ |А] ж 


ш! = (wg. ШМ, +, ш) O 


УТЕ ЕЕ л J UER Wi Un ЛЕЛИ [Н м/ 1 ,w 2 
.wwWn ， 使 得 线性 单元 对 于 训练 样本 的 实际 得 出 与 
训练 样本 的 目标 输出 尽 可 能 地 接近 。 

З. WRZE N 

ZJ f EFREN 2 2710211, E 7 521 
定义 一 个 度量 标准 来 衡量 在 当前 权 癌 量 zs ТУ АМАН 
对 于 训练 样 例 的 训练 误 和 过 (Training Error) 。 一 个 
前 见 的 度量 标准 为 平方 误 下 准则: 


S үй 
E(w) = 5 y ` (ta 本 од) 


Te D 


(15-6) 


Ан, рК, ta АКРА 的 
目标 输出 “训练 样本 d 的 类 列 信 息 〉，og ERTER 
元 对 于 训练 样本 q 的 实际 输出 ， 即 O (xa) o 


Ew) 是 目标 输出 tjy 和 实际 输出 0g 的 大 的 平方 在 
所 有 训练 样本 上 求 和 的 12 倍 ， 这 里 常数 1/2 主 要 是 
为 了 最 终 的 推导 结果 在 形式 上 的 简洁 (在 推导 过 程 
中 与 其 后 平方 项 求 导 产 生 的 因子 2 抵消 ) 。 观 察 式 
(15-6) ， 对 于 特定 的 问题 ， 训 练 集合 束 固 定 了 下 
来 ， 因 此 z 是 定 值 ， 目 标 输出 ty 也 为 定 值 (训练 样 


本 的 类 列 信息 十 已 知 的 ) ， 而 od RAKITA аа 
， 可 以 把 E 写成 是 权 癌 量 z 的 函数 。 


图 15.6 给 出 了 在 解 空间 中 搜索 的 可 视 化 解释 。 
由 于 无 法 绘制 出 超过 3 维 的 空间 ， 这 里 设 j= (wow) , 
即 要 在 2 维 解 空间 w o -w 1 中 搜索 最 小 化 式 (15-6) 
的 权 向 量 as ， 第 3 维 〈 纵 轴 ) Жл кш, К 5 
出 了 在 整个 2 维 搜索 空间 wo -w 1 上 的 误差 曲面 aa 。 
由 于 sa 是 关于 zz 的 二 次 函数 ， 这 个 误差 曲面 必然 是 
具有 单一 的 全 局 最 小 值 的 抛物 面 。 当 z 是 更 高 维 的 
权 回 量 时 ， 只 不 过 相当 于 在 一 个 更 高 维 的 解 空 间 中 
搜索 最 小 化 za 的 解 zam”， 误 差 曲面 sa 也 就 成 了 一 
个 超 抛物 面 。 


为 了 确定 一 个 使 E RMN G=, MESH 
初始 权 向 量 = ”开始 ， 然 后 以 很 小 的 步 长 反复 修改 这 
个 权 同 量 ， 而 每 一 步 的 修改 都 能 够 使 误差 已 减 小 。 
继续 这 个 过 程 直 到 找到 全 局 的 最 小 值 点 = o 


人 很 目 然 布 望 上 述 过 程 越 快 越 好 ， 因 此 在 每 一 步 
Ир Е 减 小 尽 可 能 快 ， 这样 的 寻 优 过 程 同样 可 在 
图 15.6 中 找到 可 视 化 的 解释 。 设 想 从 解 空间 中 的 任 
АЛЛАН п о 开始 出 友 ， 目 的 地 十 误 天 曲面 的 最 低 
把 ， 由 于 能 见 度 有 限 等 原因 祭 一 时 刻 只 能 看 到 距离 
目 己 很 近 的 周边 区 域 ， 因 此 每 次 只 试探 性 地 路 出 一 


ДУ, ZJ f в В PAK JK, DEENA 
ERREI H Bi Be BEI АЧ КЕЛТ], HAZA S ЛЖ — 
步 ， 在 新 的 位 置 上 将 获得 新 的 和 视野， 也 将 找到 新 的 
тн: 不 断 重 复 这 一 过 程 直 到 到 达 最 低 目 标 


/ УУУ О 



















4$ 
15 < 
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22 
“ХУ, 
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~ Awww waww... NACS py 
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` Y. Э с Se . нб 
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А. 梯度 下 | 降 法 (Gradient Descent) 的 推导 


怎样 才能 计算 出 沿 误 丰 曲面 最 快 的 下 降 方 癌 
呢 ? 在 局 等 数学 中 学 习 过 梯 上 肛 (Gradient) ВУЛ 
仿 ， 而 梯度 是 方 同 导数 最 大 的 方 同 ， 因 此 可 通过 计 
FE 相对 于 同 量 s 的 每 个 分 量 的 俩 导数 来 得 到 方 回 





导数 最 大 的 方向 一 梯度 ， 记 作 val) 。 
ӨР дЕ B дЕ 


МЕШ, | 
| n. dw дш 


та 
(15-7) 


需要 注意 的 是 梯度 vata 本 身 是 一 个 表示 方向 导 
数 最 大 方向 的 向 量 ， 因 此 它 对 应 于 E 最 快 的 上 升 广 
向 ， 而 要 寻找 的 沿 误差 曲面 最 快 的 下 降 方向 自然 就 
是 负 梯 度 一 vw) 。 所 以 梯度 下 降 的 训练 法 则 应 为 


ш — Ш + Аш 


(15-8) 


т 


Аш = —nV EW) 


(15-9) 


这 里 ， е ТЁК 2) IEP EA ERE 
了 梯度 下 降 搜 索 中 的 步 长 。s 代表 解 空 间 中 的 当前 
ТЫ Жк КА, де 代表 问 当 前 最 快 下 降 方 同 的 一 小 段位 
№, certai 则 表示 在 搜索 容 间 中 从 当前 点 沿 最 快 
ER 一 小 段 距离 并 更 新 当前 位 置 全 此 移动 
УА о 


训练 法 则 ( 式 (15-8〉 ) 也 可 以 写成 它 的 分 量 
№: 


ш; < Ш; + АШ; 


(15-10) 


т 


JE 
Аш; = == 
ш; 


(15-11) 


Eds, РЕСЕН Ea РЛ БИИ 
дЕ/ди 改变 = 中 的 每 一 个 w; 来 实现 。 剩 下 问题 的 就 是 
计算 5z/au ү, 


QE 


öd l 
диш; — ди; Өш. 2 22.08 оа) 1= 5 > =. = (ta — 04). 


WI -:У; 2(4 一 oa) = — (tu — Og) 


den 


— = \ (їч ш 0a) =— (ta 一 W Ta) 
de D 
c — у ТЕПЕ 
дє Г) 


(15-12) 


Fah, xa 表示 训练 样本 qd 的 一 个 输入 分 量 x 

在 公式 (15-12) 的 推导 过 程 中 用 到 的 是 高 等 
数学 中 复合 函数 求 导 的 知识 。 在 误差 函数 aa 的 表 
IAIN (15-7) 中 ， 对 给 定 的 一 组 样本 目标 输出 ty 为 
+ ЭХ, [КШ И: 


д 


() 
(hu; 


而 实际 输出 0g хеми; ПУРА Ж, XJ ТЕН ЛОП 


在 计算 od 对 w， jm pir, w W 其 余 分 量 w; 
5=012207 区 均 可 视 为 常数 ， 对 于 给 定 样本 ，xid 
INITA 1: 


( ) Ў, d 


Gu 

至 此 读者 得 到 了 一 个 能 够 用 线性 单元 的 输入 Xid 
， 输 出 od 以 及 训练 样本 的 目标 值 如 表示 的 5/ow , 
代入 式 (15-9) 得 到 了 柳 度 下 降 的 权 信 更 新 法 则 : 


Аш = T? 5 (ta — 04) 24 
de D 


(15-13) 


综 上 所 述 ， 训 练 线性 单元 的 梯度 下 降 算 法 如 
F: 随机 选取 一 个 初始 权 同 量 ; 计算 所 有 训练 样本 
经 过 线性 单元 的 输出 ， 然 后 根据 式 (15-13) 计算 
每 个 权 值 的 Aw ， 通 过 式 (15-10) 来 更 新 每 个 权 
值 ， 然 后 重复 这 个 过 程 。 该 算法 的 伪 代 码 描 述 如 算 
法 15.1 所 示 。 
算法 15.1 训练 线性 单元 的 梯度 下 降 算 法 


GradDesc(trainset, ») 


{//trainset 中 每 一 个 训练 样本 以 序 侦 <= > 
的 形式 给 出 ， 其 中 :是 样本 特征 问 


// 量 ， 是 系统 的 输入 ， 七 是 目标 输出 值 ， 通 
常 是 类 标签 的 某 种 编码 ，， 是 学 习 率 。 


将 每 个 网 络 权 值 w 初始 化 为 某 个 小 的 随 
机 值 ; 


遇 到 终止 条 件 之 前 ， 重 复 以 下 操作 : 
初始 化 每 个 Ao, 为 8 ; 


对 于 训练 集合 trainset 中 的 每 个 <= 


>, fW: 

把 样本 特征 同 量 z 作 为 线性 单元 的 输 
№, Яо; 

对 于 线性 单元 的 每 个 权 wi ， 做 


AW +— Аш; + yit E o)zi К 


对 于 线性 单元 的 每 个 权 о, етди; 
J 


HT KAZ ВИХ Tane B, S 
A151 RASAN НН БЛ Нен, (H E, 
ZU АЕ ЈА 2] E o WR ЖА, ЖЛ F 
БЕШ Ж AI RIRA H ЛУЇН. ЇЇ 428 РА Е 90 — 
AER, WHEQ15.7BW 28. А АСЕ R ls де bü 
看 俩 度 下 降 步 数 的 增加 而 逐渐 减 小 " КИН. 


V ы 


(а) n 很 小 时 ， 可 以 保证 收敛 (b) 较 大 的 7， 训练 将 震荡 收敛 (с) 1 过 大 ， 系 统 无 法 收敛 


图 15.7 了 对 于 梯度 下 降 搜 索 收敛 的 影响 (n o 为 搜索 起 始点 ) 


5. а К [Ж (Incremental Gradient 
Descent ) 


很 多 人 工夫 能 和 模式 识别 的 问题 最 终 都 可 转化 
为 一 个 求 最 优 的 问题 ， 而 梯度 下 降 法 作为 一 种 重要 
寻 优 手段 ， 适 用 于 满足 以 下 条 件 的 任何 情况 。 

(1) 搜索 的 假设 空间 包含 连续 参数 化 的 假设 
"sqa a kika khai ЦИЯ 
4) 。 

(2) эж (к) ) 对 于 这 些 假 设 参数 Су) 可 
微 。 

应 用 椰 度 下 降 的 主要 实践 问题 有 以 下 两 个 。 

(1) 有 时 收敛 过 程 可 能 非常 慢 (需要 上 二 次 
的 迭代 ) 。 

(2) 如 果 在 误差 曲面 上 存在 多 个 局 部 极 小 
值 ， 算 法 不 保证 能 够 找到 全 局 最 小 值 〈 与 初始 搜索 
MAAR) 。 

为 绥 解 这 些 问 题 ， 人 们 提出 了 增 量 梯度 下 降 法 
， 义 名 随机 构 上 度 下 降 。 


标准 柳 度 下 降 在 对 训练 集 D 中 的 所 有 样本 的 平 


TRAR la TF PE MB ЄТ, 20 (15-13) 中 对 所 

AD 中 样本 的 2 求 和 说 明了 这 一 点 : 而 增 量 梯度 下 
降 法 根据 每 个 单独 样本 的 误差 增 量 计 算 权 值 更 新 ， 

得 到 近似 的 梯度 下 降 搜索 。 修 改 后 的 训练 法 则 与 式 
(15-13) 相似 ， 只 是 在 迭代 计算 每 个 训练 样本 时 

根据 下 面 的 公式 来 更 新 权 值 。 


Aii = nlt — 0)T: 
(15-14) 


O WEWE FRANA А Та 7215.259 
不 。 


算法 15.2 训练 线性 单元 的 增 量 化 度 下 降 算 法 
IncGradDesc(trainset, ») 


{//trainset 中 每 一 个 训练 样本 以 友 侦 <: > 
的 形式 给 出 ， 其 中 = 是 样本 特征 回 


// 量 ， 是 系统 的 输入 ，t 是 目标 输出 值 ， 通 党 
是 类 标签 的 某 种 编码 ，， 是 学 习 率 。 


将 每 个 网 络 权 值 “初始 化 为 示 个 小 的 随机 人 
Л ЈИЕ В, ERA РЕЧЕ: 


人 急 始 化 每 个 Aw: JO ; 
对 于 训练 样本 trainset 中 的 每 个 <r 


>, fW: 

ТЕЕ KER IE ГЕ] z: ERRERA 
和 入， 计算 输出 o ; 

对 于 线性 里 元 的 每 个 权 w;， 做 


ш; + wi + nlt — о); i 


} 


ДИ ЕЛЕ ТКЕН] РАЗЫ УВА НА 
样本 d EXA ERIR РА киш) ; 


Е 1 - 
Eat) = 5(ta — od) 


(15-15) 


Е ВРА R кие) ИЛЕ РАЛУ 
А. ТЕЛАТМ ВТА АКРА ЕНУ, о ИЕ SH ўт 
的 序列 给 出 了 对 原来 误 天 函数 B03) ВУИ ЛЕ F РЕ 
ЛИД. ЯЗ дЕ, ЛЕ РЈ 
ДИИ ЛАХИК. 





提示 


标准 梯度 下 降 在 权 值 更 新 前 对 所 有 样本 汇总 误差 ， 而 增 量 梯度 下 
降 的 权 值 是 通过 考察 每 个 训练 样本 来 更 新 的 ， 如 果 E( 加 存在 多 个 局 部 
极 小 值 ， 增 量 梯度 下 降 有 时 可 避免 陷入 这 些 局 部 极 小 值 ， 因 为 它 使 用 
Еч) 而 不 是 E( 加 来 引导 搜索 。 


【 例 15.2】 寻 优 方法 比较 。 


下 面 给 出 了 除 株 度 下 降 外 的 两 种 音 用 优化 方 
法 ， 中 元 为 什么 在 ANN 的 训练 过 程 中 能 选择 这 两 种 
方法 : Їн, КА). 


(1) 由 于 可 以 写 出 az/0wi 的 表达 式 ， 一 个 可 能 
会 产生 的 疑问 是 古人 否 可 以 采用 偏 导 数 为 0 的 方法 来 
HEIR Z K Aea) 的 优化 问题 ， 毕 苋 这 是 高 等 数学 
中 有 关 多 元 函数 极 值 和 最 值 的 一 种 经 典 方 法 ， 可 能 
也 是 读者 们 面 对 优 化 问题 首先 能 够 想到 的 解决 方 
法 。 然 而 ， 这 里 要 面 对 的 通常 是 含有 大 量 权 值 的 系 
统 ， 它 对 应 着 维 数 非常 高 的 空间 中 的 误差 曲 面 〈 每 
个 权 值 1 维 ) ， 而 每 1 维 都 有 多 个 可 能 的 局 部 极 小 值 
点 (对 该 维 偏 导数 为 0); ， 这 样 总 的 候选 局 部 极 小 
值 数 目 束 是 各 个 维 上 候选 局 部 极 小 值 的 个 数 的 乘 
积 ， 这 将 是 一 个 庞大 的 数目 。 


Їй ле ЎИП ЖУАН УЧ ЙН УТУЕ НЧИ IR ЖЕ РАЖИ ПУЛ, 
化 问题 ， 设 共有 mm 个 权 值 ， 那 么 首先 要 解 一 个 由 m 
个 方程 gauw = 0. G= 12...) 组 成 的 联 立 方程 组 ， 她 且 
不 说 这 个 方程 组 的 可 解 性 如 何 ， 假 说 第 维 上 满足 


spau=0 的 解 的 个 数 为 ma=12m9， 则 总 的 候选 局 部 


极 小 值 个 数 将 是 也 ， 还 要 再 从 这 么 多 候选 中 找 出 
一 个 全 局 的 极 小 值 仍 将 是 个 十 分 棘手 的 任务 。 


(2) 对 于 线性 日 元 ， 和 学 习 权 同 量 的 义 一 种 可 

行 的 方法 是 线性 (Linear pro we К ж 
性 规划 是 解 线性 不 等 式 方程 组 的 一 种 通用 的 有 效 方 
ы 注意 在 线性 单元 训练 中 ， 每 一 个 训练 样本 对 应 
ТМА г >0 或 zz<0 的 不 等 式 ， 且 它们 的 解 吏 

х HHE НУЛУ ај. ЈЕ, 这 种 方法 仅 当 训练 样 
本 线性 可 分 时 有 人 解 。 即 便 是 在 对 它 进行 改进 之 后 也 
不 能 扩展 到 训练 多 层 网 络 。 相 反 ， 正 如 15.2.2 小 市 
将 要 讨论 的 ， 梯 度 下 降 算法 可 以 被 简单 地 扩展 到 多 
屋 网 络 ， 用 于 反问 传播 算法 的 学 习 之 中 。 


15.22 ”多 层 人 工 神经 网 络 


利用 前 面 学 过 梯度 下 降 法 训练 线性 单元 ， 只 能 
够 得 到 一 个 最 佳 拟 合 训练 数据 的 线性 超 平面 (w 
，D ) ， 这 里 b =w 0 。 然 而 线性 决策 面 的 分 类 能 力 
有 限 ， 难 以 胜任 很 多 复杂 的 分 类 任务 〈 如 汽车 目 动 
驾驶 、 光 学 字符 识别 、 人 脸 识 别 等 ) 。 多 层 人 工 神 
经 网 络 能 够 表示 种 类 繁多 的 非 线 性 曲面 ， 得 到 高 度 
非 线 性 化 的 决策 区 域 ， 如 图 15.8 所 示 。 





图 15.8 АА Јл Атау БЕЗЕ ТЕ НЕНА ЕХ E 


典型 的 ANN 神 经 元 如 图 15.9 所 示 。 输 入 信号 sz 
经 过 一 个 累加 器 累加 (整合 ) 后 的 信号 rz 被 送 入 
一 个 激活 函数 ac ， 从 而 得 到 该 神经 元 的 输出 o 。 而 
这 个 神经 元 的 输出 o 又 可 以 作为 下 一 个 或 多 个 神经 
元 的 输入 。 


415.9 ”人工 神 经 网 络 单元 


大 脑 中 神经 细胞 和 其 他 神经 细胞 是 相互 连接 在 
一 起 有 的， 人工 神 经 元 也 可 以 按照 类 似 的 方式 连接 从 
而 组 成 人 工 神经 网 络 。 一 种 最 广泛 使 用 的 连接 方式 
束 是 如 图 15.10 所 示 的 分 层 前 馈 网 络 (Feed Forward 
Network) ， 每 一 层 神 经 元 的 输出 都 前 馈 至 它们 的 
下 一 层 〈 图 15.10 中 为 右 侧 的 一 层 〉)， 直 全 获得 整个 
网 络 的 输出 。 





图 15.10 ”三 层 BP 神 经 网 络 的 结构 示意 


在 分 层 网 络 中 ， 一 般 全 少 有 3 个 层 : 一 个 输入 
层 ， 一 个 输出 层 还 有 一 个 或 多 个 隐藏 屋 。 相 邻 层 之 
司 的 持 元 是 全 连接 的 ， 即 输入 层 中 的 每 个 输入 部 连 
接 到 了 隐 震 层 的 每 一 个 神经 元 ， 而 隐 疾 层 的 每 个 神 
经 元 的 输出 者 连接 到 输出 层 的 每 一 个 神经 元 。 多 层 
网 络 可 以 解决 单 层 网 络 所 无 法 解决 的 问题 ， 如 非 线 
МЕЛ. ЛИЛЕ НУРА 908 0, RRA EBE N 


神经 元 ， 这 些 都 可 以 实现 。 
15.2.3 Sigmoidši Jú 


PRIE E 8 (+ 2l|J zÑ S NA 28 JIER PE gt ss х 
域 ， 但 多 个 线性 单元 的 连接 仍 产 生 线 性 图 数 ， 因 此 
将 多 个 线性 单元 连接 成 网 络 的 方法 过 然 古 不 可 取 
的 。 这 样 束 需要 输出 十 输 入 的 非 线 性 函数 的 单元 。 
间 时 从 仿生 学 的 角度 来 寺 碟 ，ANN 的 神经 元 也 应 当 
像 生物 神经 元 那 伞 存在 未 种 刺激 。 


于 是 采用 某 种 非 线 性 油 励 函数 作用 于 单元 的 将 
答 入， 然后 以 非 线 性 沿 励 的 啊 应 〈 溅 励 函数 的 输 
H) 作为 神经 元 的 输出 。 此 外 ， 为 了 能 够 在 网 络 训 
练 过 程 中 应 用 梯度 下 降 算 法 ， 要 求 输出 必须 是 输入 
的 可 微 函 数 。 满 足 这 些 条 件 的 一 个 理想 选择 是 如 疼 
15.11 所 示 的 Sigmoid 单 元 ， 它 以 车 名 的 Sigmoid 函 数 
作为 激励 函数 。 


| 


Mo 
пе 1 А 
n 








图 15.11 神经 网 络 中 的 Sigmoid 单 元 


仍旧 像 在 线性 单元 中 所 做 的 那样 ， 首 先 计 算 它 
的 个 输入 的 线性 组 合并 且 加 上 一 个 偏 置 w o, П 
将 Sigmoid 函 数 作用 于 这 个 结果 ， 了 最 终 以 Sigmoid 函 
数 的 输出 作为 单元 输出 o ， 从 而 实现 了 输入 到 输出 
的 非 线 性 映射 。 形 式 化 地 讲 : 





(15-16) 
HR, G= (wow w). E= (l ri ro rn) o 
M Sigmoid rA ži: 
н" 
(15-17) 


Sigmoid 函 数 的 定义 域 为 r=:+x]， 值 域 为 [0， 
11, Л НУРУ РА 9. R E u 
15.12 所 示 。 


0.5 


ананна 


0 输入 
图 15.12 ”Sigmoid 函 数 曲 线 


НҒ Sigmoid K 0369: K HI АИА ўс. ЕЕ R 
| ЈУ НУН, E ERAN Sigmoid¥ JCH 
PERA. ZRA — MRR TE, БЕН) 
数 很 容易 用 它 的 输出 来 表示 : 

doly) 


— = giy Hl — oliyi) 
dy 


(15-18) 


推导 过 程 如 下 : 














Ë S 1 
[1+e- s )2 li+e ¥ li+e 


1) = о(у)(1 — о(у)) 


[Tes е5; 


24 (15-18) Я KUK Ika КЕД Н 
ШП) ЖИИ. 








15.2.4 519/518 (Back Propagation, 
ВР) 算法 


将 多 个 Sigmoid 单 元 互相 连接 形成 如 图 15.10 上 所 
示 的 3 层 网 络 ， 反 同 传 播 算 法 可 用 来 学 习 这 个 网 络 
WHAE. EKHE FRIA, Ug MENRE 
际 输出 与 目标 输出 之 则 的 平方 误差 为 目标 。 不 同 的 
是 ， 这 里 的 输出 是 整个 网 络 的 输出 ， 而 不 再 是 单个 
单元 的 输出 ， 所 以 有 必要 重新 定义 误 羟 E ， 以 便 对 
网 络 得 出 层 的 所 有 单元 误 和 天 求 和 。 


1 <— | ‚2 
ЁШ) = = у у (ёа — Ока) 


de Г ke outputs 


(15-19) 


EF, outputs 是 网 络 输出 层 单 元 的 集合 ， 刀 5 
Mogg 是 将 训练 样本 qd 作为 网 络 输入 时 ， 在 第 k Т 
出 层 单 元 的 输出 值 ， 误 差 BE 被 看 成 是 网 络 各 层 之 间 
所 有 连接 的 权 的 函数 ， 由 这 些 权 值 共 同 决 定 。 


反 回 传播 算法 需要 在 一 个 巨大 的 解 空 间 中 搜索 
能 够 使 式 〈15-19) 最 小 化 的 s ， 这 里 = 表示 网 络 各 
层 之 间 所 有 连接 的 权 值 组 成 的 集合 ， 这 个 空间 由 网 
络 中 所 有 单元 的 所 有 可 能 权 信 来 定义 。 此 时 的 误 关 
曲面 不 再 是 图 15.6 中 的 二 次 误差 曲面 ( 超 抛 物 
I) ， 它 更 加 复杂 并 有 旦 可 能 有 多 个 局 部 极 小 值 。 
Sigmoid 单 元 的 可 短 性 使 得 使 用 者 仍然 可 以 信 助 杭 
上 度 下 降 法 来 优化 sa ， 但 此 时 梯度 下 降 仅 能 保证 收 
伐 到 局 部 最 小 值 ， 而 未 必 是 全 局 最 小 值 。 


15.2.1 小 节 中 给 出 了 训练 线性 单元 的 标准 梯度 
下 降 和 增 量 梯度 下 降 算 法 的 推导 和 伪 代 码 接 述 ， 下 
面 将 针对 如 图 15.10 所 示 的 包含 两 层 Sigmoid 蛙 元 是 
层 与 层 时 元 之 间 全 连接 的 网 络 给 出 训练 的 增 量 梯度 
下 降 算 法 推导 以 及 其 伪 代 人 码 朱 述 。 
1. 反问 传播 拭 法 的 推导 

首先 引入 以 下 记号 。 
单元 ) 的 第 i 个 输入 。 
wii 一 一 与 输入 xi;; 相关 联 的 权 值 。 


net; =), ; Wji Ху 一 一 单元 ) 的 主 输 出 《输入 的 加 
权 和 ， 未 经 过 激励 函数 ) 。 





Aji 


o ; =o (net; ) 一 一 单元 的 实际 输出 。 








О Sigmoid 函 数 。 
outputs 输出 层 单 元 的 集合 。 


增 量 柳 度 下 降 法 的 主要 特点 是 对 于 每 个 训练 样 
本 qd ， 利 用 关于 这 个 样本 的 误 牵 Eq 的 柳 度 来 修改 权 
值 。 换 言 之 ， 对 于 每 个 训练 样本 d 每 个 权 值 wi 被 增 
加 人 wii : 


Ө РЫ 
дш 





AW = 一刀 
(15-20) 


ЖН, Ea 是 训练 样本 qd 的 误差 ， 通 过 对 输出 层 
所 有 单元 的 求 和 得 到 : 


| 1 | 2 
Ёд\ш) = = 5 (tk — ор) 


keEoutputs 


(15-21) 


其 中 ,所 是 输出 层 单元 K 对 于 训练 样本 d BJ H 


标 输 出 值 ，ox 是 以 训练 样本 qd 作为 输入 时 第 KK 个 输 
出 层 单 元 的 实际 输出 。 

现在 摆 在 面前 的 问题 是 要 导出 一 个 Ед /о wii 的 
KREN. ТЕА ИН м 仅 能 通过 met 影响 网 络 的 其 
他 部 分 ， 六 此 可 利用 复合 函数 的 求 导 法 则 得 到 | 


QË _ DE Опей, 











Owji  Qnet; Ow 


DE О pI i ja ) Q Ea 








а л, “Бл 
(15-22) 

ТУРЯ ДЕН; 的 表达 式 。 

(1) 单元 是 一 个 输出 层 单元 

由 于 met 仅 能 通过 oi 影响 网 络 ， 所 以 可 再 次 利 











用 复合 函 数 的 求 导 法 则 得 ， 
ОЁч дЕ до, 
Әпе®; до; Onet; 


(15-23) 


考虑 式 (15-23) 的 第 1 项 。 


2 


дБ == Я (2 Y (1 一 Ük ) | 


о; до; 2 
н : keEoutputs 


名 -=0 ， 因 此 : 








注意 到 当 k zj ВУ, 





1 = l ЕЕ 
Jo; ðo (2 oj)” 
ж Жа =, 
= — š — 03) 


(15-24) 


接 下 来 考虑 式 (15-23) 的 第 2 项 。 

由 于 o; =0 (net; ), 所 以 a Oj /6 net; Wi Sigmoid PK 
数 的 导数 ， 根 据 式 (15-18) ，Sigmoid 函 数 的 导数 
Jo (net; )(1—o (net; ))。 因 此 有 : 


до, Doineti) ` aitai 
= Uj\ J 





net; Е Оте; 





(15-25) 


将 式 (15-24) MIÈ (15-25) 代入 式 (15- 
23) ° 得 : 


Q Ëq А р ү- L 
—(#; 一 02301 — 0) 


дпеё; 





(15-26) 


将 式 (15-26) RAR (15-22) ， 再 将 式 〈15- 
Е 代入 式 (15-20) 便 得 到 输出 单元 的 权 值 更 新 
法 则 : 





Ашу = —1 Е = ntj — oj)o;(1 — оу)ту 
(15-27) 
<; = {ti — 03)011- o;) , Ш] =Š (15-27) 可 表示 为 : 
AWji = WOT 
(15-28) 


式 〈15-28) 中 的 65; Ы отг 相等 。 下 文中 将 使 用 5; 来 表示 任意 音 
DE 
JÚi ËJ Bnet; o 


(2) 单元 д ag, = 5 Jú 


对 于 隐藏 层 单元 的 情况 ，w;ii; х [HJ ge HB s H] P) 
络 生 出 ， 从 而 影响 训练 痊 才 Egy ， 因 此 有 必要 定义 由 
单元 j 的 输出 所 能 连接 到 的 所 有 单元 的 集 
合 Downstream (j) 。 因 为 net; 只 能 通过 
Downstream (j) 中 的 单元 影响 网 络 输出 进而 影 啊 
人 Eg ， 改 有 如 下 推导 。 





те? | х Mety Unet; 
i ke Downstream 7 | 
Е _ д, Опет, 
2, oF met. 
k= Downstreami 7 Í 
с @пеї do; 
= D Ok Ho, Bnet, 
ke Downstream 3 ) | | 
= Уу) бешт 
ke Downstreaml i ) | 


== y —ók Wk; O; 1 一 ©, | 
ke Doumstreamij) 
一 = = Oj) y и ОКШ 
kë Поштзітеаті 7) 


а КСЕ 88 zj 的 权 值 
更 新 法 则 : 


(15-29) 
2. БИНЕ 


首先 创建 一 个 含有 1 个 隐藏 层 的 网 络 ， 并 随机 
地 为 这 些 神经 细胞 的 权重 赋 一 个 很 小 的 实数 值 ， 
a ry 的 数 〈 具 体 原 因 参 见 15.2.5 小 
。 然 后 把 1 个 输入 样本 问 量 计 入 网 络 的 输入 蜂 
P = 请 况 下 网 络 输入 单元 的 数目 等 于 输入 样本 特 
征 癌 量 的 维 数 ) ， 并 计算 网 络 输出 值 。 求 得 这 一 输 
出 值 和 训练 样本 目标 输出 值 之 则 的 平方 误 大 Ey о Ж! 
用 这 一 误 鼻 值 束 可 以 来 调整 输出 层 早 元 的 权 值 ， 使 
得 当 同 样 的 输入 再 次 送 入 网 络 时 ， 其 输出 能 回 正 确 


丛 采 接近 一 些 。 一 旦 输出 层 的 权 值 已 经 调整 完毕 ， 
束 可 以 对 隐 叫 层 做 同样 的 事情 。 上 述 过 程 要 对 训练 
集中 的 所 有 不 同 的 输入 样本 问 量 午 复 进行 许多 侈 
(经 钊 将 一 次 重复 称 为 一 个 时 代 一 一 Epoch) , Е 
到 误 天 全 降低 到 所 处 问题 可 以 接受 的 一 个 国人 之 
内 。 这 时 网 络 己 经 训练 好 了 。 


反问 传播 算法 的 伪 代 码 摘 述 如 算法 15.3 所 示 。 


算法 15.3 包含 两 层 Sigmoid 单 元 的 人 工 神经 网 络 
的 反问 传播 算法 〈 增 量 梯 度 下 降 版 本 ) 


BackPropagation (trainset, И, п; ,Noyt 
, Nnidden ) 


{//trainset 中 每 一 个 训练 样本 以 序 侦 <= > 
的 形式 给 出 ， 其 中 sz 是 样本 特征 问 量 ， 是 系统 的 输 
A; 


// 是 学 习 速 率 ( 例 如 6.1 或 6.65) ; Nin 是 
网 络 输入 单元 的 数量 ; Noy + 是 输出 层 单元 数量 ; 

// Nhidden/ Же Е 2 PP JG СЕК , X ji 表示 从 
单元 宇 到 单元 了 的 输入 ，w ji 表示 从 单元 到 单 
j BAUE 


870, Nout 个 输出 层 单 元 的 网 络 ; 


将 所 有 的 网 络 权 值 初始 化 为 小 的 随机 值 
(例如 -6.65 和 68.65 之 间 的 数 ) ; 


在 迪 到 终止 条 件 之 前 ， 重 复 以 下 操作 : 
对 于 训练 样本 集合 trainset 中 的 每 个 < 


// 将 输入 沿 网 络 同 前 传播 


把 样本 ;输入 网 络 ， 并 计算 网 络 中 每 个 
单元 4 的 输出 Oy ; 


// 使 误 弄 沿 网 络 反 问 传 播 


对 于 网 络 中 的 每 个 输出 单元 R， 计 算 它 
的 误 关 项 Ók ; 


бр. — all = ок lt k — Ок) ; 


ХУ 28 Н НЕТ ЖЕЕП, MRE 


HIRA Ôh ; 


дһ — оһ(1 一 ор) У шр 5, 
Є ОШИ З ° 


更 新 每 个 网 络 权 值 wji ; 
ee die 
} 
15.2.5 训练 中 的 问题 
1. 收敛 性 和 局 部 极 小 值 


反问 传播 算法 在 解 空 间 中 寻找 能 够 最 小 化 训练 
误 甜 的 网 络 权 信 。 对 于 含有 非 线 性 Sigmoid 单 元 的 
多 层 网 络 ， 误 天 曲面 可 能 含有 多 个 不 同 的 局 部 极 小 
E, E TRR RA Nn eKA RIXE ja HAME 
H. И, БИ RISIN Ren ENA ЕЦ у Е 的 
EA WARME. mA ENARE RRE o 

通过 以 下 方法 可 以 有 效 降低 搜索 俘 留 在 局 部 极 
Е 使 反 同 传播 算法 尽 可 能 地 收 合 到 全 局 
H УЗ АЕ о 


(1) 将 网 络 权 信 初始 化 为 搂 近 于 0 的 小 随机 


值 。 


注意 到 Sigmoid 函 数 在 其 输入 接近 0 时 接近 线性 
( 见 图 15.12) 。 如 果 把 网 络 权 值 初始 化 为 接近 于 0 
的 值 〈-0.05 和 0.05 之 间 的 数 ) ， 则 作为 Sigmoid 单 元 
RA Knet 也 必然 接近 于 0， 因 此 在 早期 的 梯度 下 
降 步 又 中 ， 网 络 表现 为 一 个 非常 平 消 的 函数 ， 近 似 
为 输入 的 线性 函数 ， 基 本 不 存在 局 部 极 人 的 问题 。 
当 训 练 进行 一 定时 间 后 ， 随 看 权 值 的 增长 ， 网 络 演 
变 为 可 以 表示 高 度 非 线 性 的 函数 ， 从 而 开始 出 现 更 
多 的 局 部 极 小 值 ， 但 一 般 情 况 下 此 时 搜索 已 经 足 够 
接近 全 局 最 小 值 ， 即 便 是 这 个 区 域 的 局 部 最 小 值 也 
是 可 以 接受 的 。 


(2) 增加 冲 量 项 。 


修改 得 法 15.3 中 的 权 值 更 新 法 则 ， 使 本 次 的 权 
值 的 更 新 部 分 地 依赖 于 上 一 次 达 代 时 的 更 新 ， 形 式 
如 下 : 


Awin) = бут + аАшц(п — 1) 
(15-30) 
KHH, Awi (п ) 表 示 算 法 15.3 主 循环 中 的 第 mn 


WIKRE AJE ES, MOa <1 是 一 个 称 为 冲 量 
(Momentum) 的 常数 。 式 《15-30) AMAM 


尾 算 法 15.3 中 的 权 值 更 新 法 则 ， 而 第 2 项 古刹 增 的 神 


EI, 


IENA Ya Вт 5 Е КЕ ВЈ 
ЈАМЕ т хе ВА А Н WA УКТ 2 lili 
ШШ] PR, a 的 作用 是 增加 剖 量 ， 使 这 个 球 从 一 次 
运 代 到 下 一 次 友 代 时 以 同样 的 方 同 凑 动 。 剖 星 有 时 
会 使 这 个 球 深 过 误 达 曲面 的 局 部 极 小 值 或 平坦 区 
域 。 同 时 ， 冲 量 项 还 具有 在 标 度 个 变 的 区 域 逐 渐 增 
大 搜索 步 长 ， 从 而 可 以 加 快 收敛 的 作用 。 


СЗ) 使 用 随机 的 标 度 下 降 代 谷 上 正 的 梯度 下 


В. 


算法 15.3 采 用 的 梯度 下 降 的 随机 近似 对 于 每 个 
训练 样 例 治 一 个 不 同 的 误 兰 曲面 有 效 下 降 ， 它 依 重 
这 些 俩 度 的 平均 来 近似 对 于 你 个 训练 集合 的 风 度 。 
这 些 不 同 的 误 关 曲面 通 音 有 不 同 的 局 部 极 小 值 ， 这 
使 得 下 降 过 程 不 太 可 能 陷入 未 一 个 局 部 极 小 值 。 


(4) 在 搜索 过 程 中 使 用 逐渐 减 小 的 学 习 率 。 


EERE Y Kn 能 够 在 训练 初期 加 快 收敛 进 
程 ， 然 而 对 于 复杂 的 误差 曲面 ， 较 大 的 n 第 党 使 搜 
过 有 越过 误 夺 曲面 最 小 值 而 不 是 保留 在 那 一 点 的 人 危 
险 。 因 些 ， 可 以 随 着 训练 (参见 15.5.1 小 节 ) 的 进 


(т, ЗААР), WERE НЈУ. 
(5) 179) 200400 Z o 


使 用 同样 的 训练 集训 练 多 个 网 络 ， 但 用 不 同 的 
蝴 机 值 初始 化 每 个 网 络 权 值 。 如 来 不 同 的 训练 产生 
不 同 的 局 部 极 小 值 ， 那 么 选择 对 于 独立 的 籼 试 集合 
分 类 性 能 最 好 的 网 络 。 


2. 训练 的 终止 判 据 


算法 15.3 中 并 没有 明确 指出 算法 狗 代 的 终止 条 
件 ， 退 第 有 以 下 3 种 音 用 标准 可 以 作为 网 络 训练 结 
束 的 终止 判 据 。 


(1) 在 迭代 的 次 数 到 了 一 个 固定 值 时 停止。 
“(2) 在 训练 样 例 上 的 误差 降 到 某 个 阔 值 以 下 


时 停止。 
(3) 在 独立 的 测试 样本 集合 上 的 分 类 误 弄 从 
合 东 个 标准 时 。 


终止 判 据 的 选 挤 很 是 重要 ， 因 为 在 奥 型 的 应 用 
， 友 问 传 播 算法 的 权 信 蝎 新 友 代 会 航 重 复 上 干 
， 一 味 地 增加 友 代 识 数 很 可 能 无 法 有 效 地 降低 误 
， 过 多 的 适 代 次 数 还 会 寻 致 对 训练 数据 的 过 度 执 


ВК >Ë Tr 


合 。 在 15.7.3 小 节 会 更 详细 地 讨论 这 个 问题 。 


15.3 ”基于 ANN 的 数字 字符 识别 系 
zi DigitRec— ¿fr 5 We I| 


在 充分 了 解 了 ANN 理 论 知识 的 基础 上 ， 本 节 将 
介绍 一 个 基于 ANN 的 数字 字符 识别 条 例 ， 学 习 如 何 
将 功能 强大 的 ANN 应 用 于 工程 实践 中 ， 着 重 说 明 反 
回 传播 算法 在 实际 使 用 中 的 一 些 具体 设计 问题 。 


15.3.1 任务 摘 述 


任务 是 设计 一 个 数字 字符 识别 系统 ， 它 可 以 对 
从 0 到 9 的 10 个 数字 进行 识 列 。 系 统 输入 是 人 台 有 0 一 9 
中 某 一 个 数字 的 图 像 ， 输 出 应 为 0 一 9 之 间 的 东 个 
数 ， 指 出 了 图 像 中 售 有 的 到 压 是 哪 一 个 数字 。 


15.3.2 ”数据 集 人 简介 


数据 集 位 于 本 书 配套 光盘 中 第 15 章 目录 下 的 
Dataset 文 件 夹 中 。 其 中 的 Trainset 为 训练 集合 目录 ， 
义 包 含 10 个 子 文 件 夹 ， 每 个 子 文 件 夹 下 含有 1 类 数 
字 有 的 训练 样本 图 像 ， 子 文件 夹 的 名 字 可 作为 设 类 样 
本 的 类 名 ; Testset 为 独立 的 测试 集 上 目录， 所 有 的 测 
试图 像 都 位 于 其 中 。 


对 于 每 个 数字 ， 本 书 都 有 5 幅 大 小 均 为 64x32 的 
样本 图 像 ， 其 中 4 个 被 用 作 训 练 ， 和 独 余 的 1 个 用 于 测 
试 。 为 了 首先 能 够 将 注意 力 集中 于 神经 网 络 本 和 号 ， 
在 本 布 的 蓉 例 中 ， 数 据 集中 的 均 是 没有 了 噪声 的 二 人 
图 像 ， 且 其 中 的 数字 有 具有 近似 相等 的 大 小 ， 如 和 图 
15.13 所 示 。 这 样 数 据 集 无 需 质 处 理 束 可 以 用 于 训练 
和 和 分类。 在 15.6 方 ， 将 进一步 为 这 个 工程 加 入 必要 
的 图 像 预 处 理 环 庆 ， 以 使 得 该 数字 识别 系统 可 以 接 
受 更 为 一 般 的 输入 。 
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415.13 ”经 过 预 处 理 的 数字 字符 数据 集 
15.3.3 ”设计 要 所 


当 应 用 ANN 于 条 个 具体 的 分 类 任务 时 ， 必 须 自 
完 解决 以 下 几 个 天 键 的 设计 问题 。 


1. 输入 编码 


既然 要 识 询 的 对 象 是 图 像 中 的 数字 字符 ，ANN 
的 输入 必然 是 这 幅 图 像 的 未 种 表示 ， 或 痢 说 是 能 够 


IVAI ИЕШЕ, ЯД ЛУ JA EI F iela dr a F 
的 特征 呢 ? 


一 种 思路 是 对 图 像 进行 处 理 ， 分 解 出 边缘 、 区 
域 等 局 部 图 像 特 征 ， 然 后 把 这 些 特 征 作 为 网 络 的 输 
和 入。 然而， 这 会 导致 每 幅 图 像 有 不 同 数量 的 特征 参 
数 〈 如 区 域 的 数量 ) ， 不 适用 于 ANN 这 样 具 有 固定 
数量 输入 单元 的 分 类 和 需 。 


另 一 种 思路 是 先 使 用 PCA 之 类 的 处 理 方法 对 原 
始 图 像 进行 降 维 〈 在 16.4 节 基于 PCA 和 SVM 的 人 脸 
识别 系统 中 就 是 这 样 做 的 ) ， 使 用 降 维 后 统一 长 度 
的 特征 同 量 作为 ANN 的 输入 。 


然而 由 于 神经 网 络 的 输入 彰 稼 是 来 目 传 感 邦 的 
数据 ， 且 这 些 输入 之 间 可 以 高 度 相 关 ， 因 此 一 般 的 
做 法 是 不 在 训练 之 前 进行 去 除 相 天性 的 降 维 处 理 ， 
而 是 直接 以 匈 像 的 全 部 像 际 作为 输入 特征 ， 残 像 目 
动 骤 驶 系统 ALVINN 中 所 做 的 那样 。 这 样 做 一 方面 
可 以 省 去 降 维 产生 的 计算 量 ， 男 一 方面 也 可 以 为 神 
经 网 络 从 样本 中 学 习 提 供 更 大 的 自由 度 。 


2. ЕЖ 


卫 接 按照 上 述 方式 编 公 的 特征 问 量 的 维 数 古 图 
KI К АШУ ДЕЙН, H T ЇН ИЛЕШ A. Ba Ju 


A H ЯШ ЛЕЛЕ HS, [КШ ҖЕ ЕН ЛПНЫН КЕ 
Хаж) АЛЕ, птш ЖАЛЛА) ДЕ РУ 
因此 在 编码 之 前 经 常 需要 对 训练 样本 图 像 进 行 重 采 
Ai 


在 DigitRec 工 程 中 ， 在 文件 NeuralData.h 中 定义 
了 宏 RESAMPLE_LEN 作 为 步 长 ， 需 要 时 可 以 此 步 
长 对 图 像 进行 重 采 样 。 由 于 训练 图 像 大 小 均 为 
64x32， 通 过 设置 RESAMPLE LEN 为 4， 可 将 图 像 
统一 采样 到 16x8 的 分 辨 率 。 采 样 图 像 是 原 64x32 像 
系 图 像 的 低 分 辨识 接 述 ， 而 每 个 低 分 辩 识 像 系 是 根 
据 对 应 的 局 部 高 分 辩 鞭 像 了 系 灰 度 的 均值 计算 得 到 
НАЈ ЖЧТ НИК 724 КЇ п] РДЫ С) Р АЛУ 
值 数量 ， 从 而 降低 运算 量 ， 并 且 同 时 也 保留 了 足够 
的 分 辨 率 以 正确 识别 图 像 。 
上 

重 采 样 的 方式 要 结合 具体 应 用 而 定 。 如 在 ALVINN 这 样 的 实时 性 
要 求 较 高 的 系统 中 ， 每 一 个 低 分 辩 率 像素 的 灰 度 等 于 从 高 分 率 图 像 对 
应 的 区 域 中 随机 选取 一 个 像素 的 灰 度 ， 而 不 是 这 个 区 域 中 所 有 像素 的 
均值 ， 这 会 大 大 减少 从 高 分 辩 率 图 像 产生 低 分 辨 率 图 像 所 需 的 运算 


EE. 


3. 数据 归 一 化 (Scaling) 
数据 归 一 化 是 指 将 输入 特征 的 各 个 属性 缩放 全 


一 个 统一 的 区 间 内 ， 从 而 使 得 各 个 属性 在 分 类 中 具 
有 相同 的 页 献 。 


归 一 化 的 一 般 做 法 是 将 特征 的 各 个 属性 线性 地 
顷 放 至 区 则 [0，1]。 但 由 于 数据 集中 的 图 像 均 为 二 
ERZ, CAAF ARA, KEE RET 
化 的 步骤 。 有 关 归 一 化 的 必要 性 和 具体 方法 的 讨论 
请 参见 16.4.3 小 节 。 


4. 输出 编码 


对 于 一 个 n 类 问题 ， 网 络 必须 能 够 输出 n 个 值 
来 对 应 这 个 类 列 。 下 面 给 出 弟 用 的 3 种 输出 层 编 码 
і. 


(1) Н НУН лп 种 情况 的 
分 类 。 例 如 ， 对 于 数字 识别 这 样 的 10 类 问题 ， 可 以 
§ 定 输出 0、0.1、0.2、0.3、...、0.9 (Sigmoid 单 元 
的 输出 在 0 一 1 之 间 〉 来 编码 这 10 个 可 能 的 值 。 


(2) 输出 单元 为 闫 别 信息 的 二 进 制 编码 形 
式 。 例 如 ， 对 于 数字 识别 这 样 的 10 类 问题 ， 采 用 
842119, Жү ж АТ ШШ НЕ, KIA 914 у 
0011， 类 别 8 为 1000， 而 类 别 10 为 1010。 


(3) 使 用 同类 别 数 目 n 相等 的 输出 单元 数目 ， 
每 个 输出 对 应 于 1 种 类 别 标 写 ， 训 练 时 对 于 第 i 类 样 


本 将 第 i 个 输出 单元 设置 一 个 高 值 (10.9) ， 而 其 
他 单元 设置 低 值 (如 0.1) 作为 目标 输出 ， 而 测试 时 
取 上 共有 最 高 值 的 输出 单元 编号 作为 网 络 的 预 出 但 。 

这 种 方法 经 常 被 称 为 n 取 1(1-of-n ) 输 出 编码 ， 其 两 

个 主要 优点 如 下 。 


O 相 比 于 单一 输出 单元 的 编 公 方 条 ，n 取 1 方 
法 使 得 在 输出 层 单元 中 有 了 mnm 倍 的 可 用 权 值 ， 这 无 
ENAR H Er RAE S ER H HR 


D 除了 可 提供 类 别 信息 外 ， 还 可 提供 有 天 分 类 
决策 的 可 徘 性 信息 。 例 如 ， 可 以 将 最 蜗 输 出 值 与 多 
ra Н BL [B] НЧ yp fE ЖАЛ Jt l| НУ ЕЕ В. 


本 书 的 数字 识别 系统 采用 了 上 述 的 第 3 种 方 
宁 。 网 络 共 有 10 个 输出 时 元 ， 训 练 阶 段 以 
<1,0,0,0,0,0,0,0,0,0> 来 编码 数字 “0”( 第 0 类 ) ， 
<0,1,0,0,0,0,0,0,0,0> 来 编码 数字 “1”( 第 1 类 ) , Ж 
类 推 。 测 试 时 如 果实 际 输出 为 <0.13, 0.35, 0.08, 
0.06, 0.75, 0.45, 0.25, 0.1, 0.52, 0.28>， 则 可 确定 类 
别 为 最 大 输出 单元 的 编号 4， 即 为 数字 “4”， 而 本 次 
分 类 的 置信 和 度 为 0.75-0.52=0.23。 


vy = 
,了 局 





对 于 目标 输出 ， 通 常 使 用 0.1 和 0.9， 而 不 是 0 和 1， 例 如 用 
<0.9,0.1,0.1,0.1,0.1,0.1, 0.1,0.1,0.1,0.1> 来 编码 数字 “0”， 而 不 是 
<1,0,0,0,0,0,0,0,0,0>。 避 人 免 在 目标 输出 中 使 用 0 和 1 的 原因 是 Sigmoid 孙 


数 的 输出 一 般 为 0，1 之 内 的 数 ， 只 有 在 输入 趋 近 于 -so 和 +oe J aAa 
近 于 0 和 1， 而 不 可 能 达到 。 如 果 以 0、1 为 目标 输出 将 导致 训练 难以 收 


化 。 


5. Ж E ЕЛАН 


在 得 到 了 输入 数目 和 输出 层 蛙 元 数目 之 后 ， 偿 
项 要 决定 隐 叫 层 的 数目 以 及 每 个 隐藏 层 的 蛙 元 数目 
Л Чел ИН ЛЕ M R ETS o 


在 ANN 的 设计 中 ， 使 用 1 个 隐藏 层 是 最 为 普通 
的 ， 倡 尔 会 使 用 2 个 ， 更 多 的 隐 攻 层 会 使 训练 时 间 
变 得 很 长 ， 因 此 很 少 使 用 。 实 际 上 ， 对 于 一 般 的 问 
дА В БЕЛЛ, Ll Z ДЕЛ? 了。 


1, SE Z Ж P= ЕЛ H ы ПК H Z HJ 
权 值 ， 这 为 网 络 拟 合 训练 数据 提供 了 更 大 的 自由 
上 腻 ， 因 此 含有 更 多 隐 着 层 蛙 元 的 网 络 通 和 党 在 训练 时 
收敛 更 快 。 然 而 ， 隐 基层 单元 数目 也 不 宜 过 多 ， 因 
为 这 样 做 在 大 大 增加 训练 时 间 的 同时 并 不 会 显著 地 
提高 泛 化 精度 〈 分 类 器 在 独立 测试 集 上 的 识别 
率 ) ， 甚 至 还 有 可 能 由 于 过 上 度 拟 合 而 导致 在 独立 济 
试 集 上 的 识别 率 下 降 ， 降 低 网 络 的 抗 噪 声 能 力 。 在 
15.7 世 中 我 们 符 试 了 分 别 及 用 4 个 、10 个 和 30 个 隐 层 
单元 ， 并 比较 了 它们 的 泛 化 结果 。 


6. 网 络 其 他 参数 的 设 定 


之 前 已 经 提 到 过 学 习 率 夏 要 设置 的 足够 小 ， 以 
防止 搜索 步 长 太 大 而 越过 误差 曲面 最 小 值 。 一 般 来 
襄 ， 如 果 采 用 的 是 标准 梯度 下 降 ， 可 以 考虑 将 n 的 
初始 值 设 定 为 0.3， 如 果 是 增 量 梯度 下 降 则 更 小 的 学 
习 率 通常 是 合适 的 ， 如 0.1 或 者 0.05。 当 随 着 训练 的 
进行 ， 误 左 值 不 再 继续 减少 或 者 在 菜 一 区 间 反 复 宕 
滨 ， 这 时 适当 地 减 小 n 的 取 值 ， 很 多 情况 下 可 以 进 
一 步 减 小 误 兰 ， 使 训练 继续 有 效 地 进行 下 去 。 

关于 冲 量 项 a ， 一 般 来 说 没有 一 个 经 验 性 的 值 
可 供 参 考 ， 读 者 需 要 根据 具体 问题 通过 实验 来 确 
ж. DigitRec ГА Ж УМА 770.6, PÆ 
neuron.h ХУ ИН o 


15.4 基于 ANN 的 数字 字符 识别 系 
统一 DigitRec 的 实现 

本 六 主要 介绍 DigitRec 系 统 的 Visual C++ 实现 ， 
包括 神经 网 络 类 库 的 构建 ， 反 同 传 播 算法 的 实现 以 
及 训 纤 数据 载 入 的 相关 操作 。 
15.4.1 构建 神经 元 结构 


首先 从 网 络 的 了 最 基本 的 单元 人 工 神经 元 
(Neurom 开 始 。 由 之 前 的 讨论 可 知人 工 神经 细胞 具 





SNeuron 





有 一 定数 目的 输入 ， 且 每 一 个 输入 都 对 应 于 一 个 权 
值 ， 因 此 在 SNeuron 的 定义 中 需要 一 个 记录 神经 细 
胞 输入 个 数 的 整 型 变量 和 一 个 表示 其 权 值 的 双 精 虐 
型 问 量 。 此 外 ， 为 了 方便 输入 的 前 同 传 播 与 误 天 的 
反 回 传播 计算 ， 还 需要 保存 每 个 神经 细胞 的 误差 仁 
(输出 ) ， 这 些 信 都 是 极 算 法 频 索 人 存 取 


完整 的 SNeuron 定 义 如 下 ， 它 位 于 DigitRec 工 程 
的 neuron.h 头 文件 中 。 


struct SNeuron // 神经 细胞 ， 神 经 元 


{ 

/////////////////////////////////209ps7//7//////////7//7/ 
/////////////// 

int m nInput; // 输 入 数目 

WEIGHT_TYPE *m_pWeights; // 对 应 输入 的 权 值 数组 
#ifdefNEED MOMENTUM 

WEIGHT TYPE *m pPrevUpdate; // 在 引入 冲 量 项 时 用 于 记录 上 


— HJ B SE 7 
#endif 

double m_dActivation; // 激励 值 输出 值 “经 过 Sigmoid 
函数 之 后 的 值 


double m dError; // 误差 值 


/////////////////////////////////J3://///////////// 
/////////////// 
void Init(int nInput) 
{ 
т пІприё = пІприё+1; //H 9—19 21, ЛН Ze 
实际 输入 数目 +1 


m pWeights = new МЕІСНТ ТҮРЕ[т nInput]; // 为 权 值 数 
组 分 配 空 间 
#ifdef NEED MOMENTUM 

т pPrevUpdate = new WEIGHT TYPE[m nInput]; // 为 上 
一 次 权 值 数组 分 配 空 间 
#endif 


m dActivation = Ө; // 神 经 元 响应 (输出 )， 经 过 sigmoid 激 
ЈР 9 
m_dError = 0; // 神 经 元 的 误差 人 
J 


~SNeuron() 


{ 
// 释 放空 间 
delete [|m pWeights; 
#ifdef NEED MOMENTUM 
delete | ]m pPrevUpdate; 
#endif 


) 


y; //SNeuron 


В 1 AE E Бу РА ТН К. 


(1) NM ЛЕУ Б тА АР нп _dError#l 
m_dActivation 分 别 记 录 看 神经 细胞 k PIRES 和 
[п] У IL Ok o 


(2) 初始 化 函数 Init( ) 以 神经 元 的 输入 数目 
nlnput 作为 参数 ， 它 为 权 值 数组 动态 分 配 / nlnput 
+1 个 WEIGHT_TYPE 类 型 的 空间 ， 对 应 于 nlInput 的 


输入 权 值 外 加 偏 置 项 w oo ПШУ/Е1ЇСНТ_ТҮРЕЛ KI 
络 中 权 信 的 数据 类 型 ， 在 neuron.h 文 件 的 开始 部 分 
由 下 面 的 语句 定义 : 





这 样 做 的 好 处 是 使 得 操作 者 可 以 统一 官 理 网 络 
中 所 有 仅 值 的 数据 类 型 。 


(3) 下 面 是 和 15.2.5 小 节 提 到 的 冲 量 项 
(Momentum) 有 关 的 条 件 编译 指令 。 


#ifdefNEED MOMENTUM 
т pPrevUpdate = new WEIGHT TYPE[m nInput]; // 为 上 一 
次 权 值 数组 分 配 空间 


#endif 





LEPENKA С 2 [2 ШЛ|2 AEN, H 
mifEneuron.hHJ НИН ЛЛ A 22 МК. 


#define NEED_MOMENTUM 


FF, ИН ul с 7J2JJ жу СН, 
m_pPrevUpdate 分 配 至 间 ， 它 记录 着 前 一 次 的 权 信 


(4) SNeuron 中 所 有 动态 数组 的 释放 都 放 在 了 
析 构 函数 一 SNeuron( ) 中 。 


15.4.2 ”构建 神经 网 络 网 络 层 


—SNeuronLayer 


在 神经 元 结构 的 基础 上 可 以 很 容易 地 构建 神经 
网 络 层 结构 (SNeuronLayer) ， 它 定义 了 一 个 如 图 
15.14 所 示 的 由 虚线 包围 的 神经 元 细胞 所 组 成 的 层 。 





图 15.14 ”神经 网 络 层 结构 


完整 的 SNeuronLayer 定 义 如 下 ， 它 位 于 
DigitRec 工 程 的 neuron.h 头 文件 中 。 





struct SNeuronLayer // 神 经 网 络 层 


/////////////////////////////////%Х%а/////////////// 
/////////////// 


int m_nNeuron; // 该 层 的 神经 元 数目 
SNeuron *m pNeurons; // 神 经 元 数组 


////////////////////////////////7775//////////////// 
//////////////// 


SNeuronLayer(int nNeuron, int nInputsPerNeuron ) 


l 


m nNeuron = пМеигоп; 
m pNeurons = new SNeuron[nNeuron]; // 分 配 nNeuron 个 


神经 元 的 数组 空间 


for(int i=0; i<nNeuron; i++) 


l 
m_pNeurons[i].Init(nInputsPerNeuron); //#HZ%J ú 


始 化 
} 
} 


~SNeuronLayer() 
delete []m_pNeurons; // 释 放 神 经 元 数组 


} 
};//SNeuronLayer 


成 员 变 量 与 函数 说 明 如 下 。 


(1) 下 和 面 的 语句 定义 了 一 个 神经 元 动态 数 
组 ， 并 在 构 寺 尔 数 中 根据 表示 该 层 伸 经 元 数目 的 参 
数 nNeuron 为 其 分 配 了 空间 。 


SNeuron *m pNeurons; 


(2) 参数 nInputsPerNeuron 表 示 每 个 神经 元 的 
得 入 数目 ， 用 于 在 构造 函数 中 对 层 内 神经 元 进行 初 
URM o 


(3) 构造 函数 SNeuronLayer( )#% 71 3412—70 
动态 数组 m_pNeurons 分 配 空 间 ， 并 对 每 个 神经 元 进 
行礼 始 化 。 

(4) 析 构 图 数 一 SNeuron( ) 负 贡 神 经 元 动态 数 
组 的 释放 。 


15.4.3 ”神经 网 络 信息 头 
一 一 NeuralNet Header 


在 头 文 件 neuron.h 中 还 有 关于 结构 
NeuralNet_Header 的 定义 ， 作 为 一 个 网 络 基本 参数 
配置 的 信息 头 ， 在 保存 训练 成 果 时 访 结 构 将 随同 权 
ni 


NeuralNet_ Header 结 构 体 的 完整 定义 如 下 。 





//////////////////AA4C UZ ТЕЕ ЛЕН ///////////// 
l 


DWORD dwVersion; // 版 本 信息 


// 初始 化 参数 ， 不 可 更 改 


int m_nInput; // 网 络 输入 数目 

int m_nOutput; // 网 络 和 输出 单元 数目 

int m_nHiddenLayer; // 隐 茂 层 数目 ，DigitRec 中 只 文 持 1 个 
кы a= 


// 可 在 每 次 训练 前 设置 的 参数 

int m_nNeuronsPerLyr; // 82 70 H 

int m_nEpochs; // ЛІН СИЕ ИЛЕШЕТ Х®О 
y; //NEURALNET HEADER 





15.4.4 神经 网 络 类 一 -CNeuralNet 


现在 开始 在 神经 元 结构 和 层 结构 的 基础 上 构建 
一 个 如 图 15.10 所 示 的 人 台 有 1 个 隐 疾 层 的 网 络 
CNeuralNet。 


CNeuralNet 类 中 应 包含 指 问 隐 汗 层 和 输出 层 的 
指 秆 ， 此 外 还 应 具有 一 些 网 络 和 训练 相 天 的 配置 信 
已 ， 以 及 训练 时 代数 和 当前 训练 误 和 等 动态 信息 。 
类 的 方法 应 包括 与 网 络 训练 、 识 别 有 天 的 图 数 ， 一 
16 Тра, ЕЛ Е ДТ. КОРА 
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DigitRec 工 程 的 neuralnet.h 文 件 中 。 


// 神 经 网 络 类 定义 


class CNeuralNet 


l 


private: 


/ 


RA 


/////// 初始 化 参数 ,训练 开始 至 结束 过 程 中 不 能 修改 /////// 


int m_nInput; // 输 入 单元 数目 
int m_nOutput; // 输 出 单元 数目 
int m_nNeuronsPerLyr; // 隐 藏 层 单元 数目 


// REJAH, PUR mh 


int m nHiddenLayer; 


// 训 练 配 置信 息 
int m_nMaxEpoch; // 最 大 训练 时 代数 目 
double m dMinError; // 误 差 阔 值 


/////////////////////////////////// 

// 动态 参数 

int m_nEpochs; 

double m_dLearningRate; 

double m_dErrorSum; // АУК 1028 

double m_dErr; // 一 个 时 代 的 平均 到 每 一 次 训练 、 每 个 输出 的 


bool m_bstopj;// 控 制 训 练 过 程 是 合 中 途 停止 


SNeuronLayer *m pHiddenLyr; // = 
SNeuronLayer *m pOutLyr; // 输 出 层 


vector<double> т vecError; // 训 练 过 程 中 对 应 于 各 个 时 代 


的 训练 误 到 
public: 


// 构造 函数 


CNeuralNet(int nInput, int nOutput, int nNeuronsPer 


Lyr); 


~CNeuralNet(); 


void InitializeNetwork();// 初始 化 网 络 


bool CalculateOutput(vector<double> input, vector<d 
ouble> &output); 
// 计算 网 络 输出 ， 前 癌 传 播 

bool TrainingEpoch(vector<iovector>& inputs, vector 
<iovector>& outputs); 
// 训练 一 个 时 代 ， 反 问 调整 

bool Train(vector<iovector>& SetIn, vector<iovector 
>& SetOut); 
// 整 个 反问 传播 训练 过 程 


// 识别 余 一 个 未 知 类 别 样 本 ， 人 返回 类 列 标 号 
int Recognize(CString strPathName, CRect rt, double 
&dConfidence); 


// 获取 参数 

double GetErrorSum() í return m dErrorSum; } // 返 加 
`B {М 2 

double GetError() {return m dErr; } // 返 回 平均 误差 

int GetEpoch() í return m_nEpochs; } // 返 回 时 代数 

int GetNumOutput() í return m_nOutput; } // 返 回 输出 


层 音 元 数目 
int GetNumInput() í return m_nInput; } // 返 回 输入 层 
单元 数目 


int GetNumNeuronsPerLyr() í return m_nNeuronsPerLyr 


РА 3-9 H 


// 设 定 训练 配置 信息 

void SetMaxEpoch(int nMaxEpoch) í m nMaxEpoch = nMa 
хЕросһ; } 

void SetMinError(double dMinError) í т аміпЕггог = 


dMinError; } 
void SetLearningRate(double dLearningRate) { m dLea 
rningRate = dLearningRate; } 


void SetStopFlag(BOOL bStop) í m bstop = bStop; } 


// АТВ СИ: 


bool SaveToFile(const char* lpszFileName, bool bCre 


ate = true); // 保 存 训练 结果 
bool Q a char* lpszFileName, DWORD d 
wStartPos = Ө); // 装 载 训练 结果 


protected: 
void CreateNetwork(); // 建 并 网 络 ， 为 各 层 蛙 元 分 配 空间 


// Sigmoid 激励 函数 
double Sigmoid(double netinput) 


{ 
double response = 1.0; // 控 制 水 数 陡 骨 程度 的 参数 


return ( 1 / ( 1 + exp(-netinput / response))); 


} 
}; 


№ 1 АЁ ңї r К. 


(1) 与 网 络 及 训练 相关 的 配置 信息 包括 输入 
单元 数目 m_nInput、 输 出 单元 数目 m_nOutput、 隐 
380 5 ВВ. 725 Н па пМецгопѕРегі. уг. 8% Н 
m_nHiddenLayer I № % >J т а еапіпоВаѓе2% . 


(2) 成 员 m „Ералы en 
АДЕ ВЕЗЕ Hl, У КНИА Е K 2А 
ШНТМН) АТР 26 


(3) 网 络 的 主体 数据 结构 为 两 个 
SNeuronLayer 关 型 的 指 同 层 结构 的 指针 ， 其 中 
m_pHiddenLyr 2/2, т рош уг? H] 4a H 
р. MEN] RAE a] pJ, HH 
m_pHiddenLyr-> т рМ№ецгопѕ[1]51 HJ / 8217 i 
J D 


ERRAK KAU F o 


CNeuralNet 奖 捉 供 了 与 网 络 训练 、 识 别 有 关 的 
方法 ，3 个 获取 参数 的 接口 图 数 以 及 负责 保存 和 小 
载 训练 成 果 文 件 的 2 个 方法 SaveToFile 和 和 
LoadFromFile。 此 外 ，Sigmoid 激 励 函 数 的 实现 也 被 
封装 在 CNeuralNet 中 。 


在 CNeuralNet 的 区 定义 中 已 经 给 出 了 一 部 分 方 
法 的 实现 细 下 ， 其 他 英 成 员 函 数 的 实现 位 于 
neuralNet.cpp 文 件 中 。 下 面 吏 一 绎 重要 的 成 员 男 数 
l [| sss 


(1) М K A —CNeuralNet::CNeuralNet 
主要 负责 初始 化 与 网 络 和 训练 相关 的 基本 信 
轧 ， 包 括 输 入 单元 数目 m_nInput、 输 出 单元 数目 


m_nOutput、 每 个 隐 世 层 单 元 数目 
m_nNeuronsPerLyr lA Л 85:5 Н m_nHiddenLayer 


等 。 实 现 如 下 。 


CNeuralNet::CNeuralNet(int nInput, int nOutput, int nNe 
uronsPerLyr) 


l 


m_nHiddenLayer = 1; // 和 暂时 只 文 持 一 个 隐藏 层 的 网 络 
m _nlnput = пІприї; 

m nOutput = nOutput; 

m nNeuronsPerLyr = nNeuronsPerLyr; 


m рніааепіуг = NULL; 
m pOutLyr = NULL; 


CreateNetwork(); // 为 网 络 各 层 分 配 空间 
InitializeNetwork(); // 初始 化 整个 网 络 





РЁ ЖЕН Н / CreateNetwork( ) 方 法 为 网 络 各 层 
分 配 空 间 ， 并 且 通 过 InitializeNetwork( ) 初 始 化 整个 
网 络 。 稍 后 将 介绍 这 2 个 方法 。 


(2) 分 配 网 络 衬 辐 
—CNeuralNet::CreateNetwork 

ZD Eu] АХ, Е БЕЛШ tH 2 а. Jú 27 
配 了 空间 ， 实 现 如 下 。 





void CNeuralNet::CreateNetwork() 
l 


т pHiddenLyr = new SNeuronLayer(m_nNeuronsPerLyr, m 


_nInput); 
т pOutLyr = new SNeuronLayer(m nOutput, т nNeuronsP 
erLyr); 





(з) 网 络 权 值 初始 化 一 void 
CNeuralNet::Initialize Network 


该 方法 主要 负责 网 络 和 训练 的 重要 参数 的 初始 
化 ， 包 括 隐藏 层 和 输出 层 每 个 单元 的 每 个 权 值 ， 上 
一 雇 的 权 信 更 新 m_pPrevUpdate[i 使 用 冲 量 项 
时 ) ， 以 及 当前 的 训练 误差 和 训练 时 代数 目 。 


根据 算法 15.3， 将 权 值 初始 为 1 个 -0.05 到 0.05 之 
ЇН) ) ЛУ ЛЛ, Р&%ЧКапдйотС1атра( ) 可 以 返回 一 
个 绝对 值 小 于 WEIGHT FACTOR 的 随机 双 精 度 型 
数 ， 其 中 WEIGHT _ FACTOR 和 两 个 相关 的 随机 函 
数 均 在 汰 文件 neuralnet.h 中 被 定义 。 





J Г жжжжжжжжжжжжж УИА Е У BE EN рж жжжжжжжжжжжж у у 
#define МЕІСНТ ЕАСТОВ 0.1 //— KT Ө 小 于 1 的 浮 点 数 ， 
用 来 限定 初始 权 信 的 范围 


// 返 回 一 个 6，1 之 间 的 随机 浮 点 数 
inline double RandFloat() {return (rand())/(RAND MA 
Х+1.0);} 


// 返 回 一 个 大 于 -1 小 于 ІВ SA SO 
inline double RandomClamped() {return WEIGHT FACTOR 


5 - RandFloat());} 


KIR же РАВЕМ Jan 4 ЛАН, ЕЕ HJ Е] 
样 的 数据 训练 多 个 网 络 ， 可 以 避免 训练 算法 每 次 部 
陷入 同样 的 局 部 极 小 值 (参见 15.2.5 小 节 ) 。 因 此 
在 实现 时 应 注意 每 次 初始 化 之 有 鲁 先 以 调用 srandO 矣 
数 设 定 随机 和 种子。 通过 使 用 当前 时 间作 为 随机 种 
E A] PLIAKUEFE Y RER ZIT p EA EA ЛЛ? 
列 。 





当 需 要 增加 神 量 项 时 ， 将 每 个 权 信 的 上 一 次 更 
狐 值 彻 妈 化 为 0， 这 是 因为 在 第 1 个 时 代 的 训练 开始 
之 前 ， 还 没有 上 一 次 的 权 信 更 新 信息 。 


#ifdef NEED _ MOMENTUM 
// 第 1 个 时 代 的 训练 开始 之 前 ， 还 没有 上 一 次 的 权 值 更 新 信息 
m pHiddenLyr->m pNeurons[i].m pPrevUpdate[j] = е; 
#endif 





InitializeNetwork() 方 法 的 完整 实现 如 下 。 





void CNeuralNet::InitializeNetwork() 


l 
int i, j; // 循 环 变 量 


// 使 用 当前 时 间作 为 随机 种 子 ， 这 样 可 以 保证 程序 每 次 运行 产生 
不 同 的 念 随机 序列 
srand((unsigned)time(NULL)); 


/ ГАВА Ва АУ IB 
for(i=0; і<т рнНіааепіуг- >т nNeuron; i++) 
l 
for(j=0; ј<т рніааепіуг- >т pNeurons[i].m nInput; j 
++) 
l 
m pHiddenLyr->m pNeurons[ i].m pWeights[|j] = Rand 
omClamped( ) ; 
#ifdef NEED _ MOMENTUM 
// 第 1 个 时 代 的 训练 开始 之 前 ， 还 没有 上 一 次 的 权 值 更 新 信 


息 
m pHiddenLyr->m pNeurons[i].m pPrevUpdate[j] = 6 
#endif 
J 
J 
// 初 始 化 输出 层 权 值 
for(i=0; i<m pOutLyr->m nNeuron; i++) 
l 
for(j=0; j<m_pOutLyr->m_pNeurons[i].m_nInput; j++) 
l 


m pOutLyr->m pNeurons[|i].m pWeights[|j] = RandomC 
lamped(); 


#ifdef NEED MOMENTUM 
// 第 1 个 时 代 的 训练 开始 之 前 ， 还 没有 上 一 次 的 权 值 更 新 信 
H 
m pOutLyr->m _pNeurons[i].m рРгемураа+е[5 | = е; 
#endif 
J 


} 


т dErrorSum = 9999.0; // 杞 识 化 为 一 个 很 大 的 训练 误 莽 ， 将 
随 着 训练 进行 逐渐 减 小 
m_nEpochs = Ө; // 当 前 训练 时 代数 目 


} 





(4) 输入 的 前 同 传 播 一 -bool 


CNeuralNet::CalculateOutput 


该 方法 可 谓 是 神经 网 络 的 “主要 天 动力 ”， 

它 负 责 网 络 输入 的 前 同 传播 。 双 精度 同 量 参 ж. 
vector<double> input 表 示 1 个 训练 样本 的 特征 问 量 ， 
它 被 作为 网 络 的 输入 传递 进来 。CalculateOutputO) 通 
过 对 每 个 层 的 循环 来 处 理 输入 和 对 应 权重 的 相 乘 与 
累加 ， 再 以 所 得 的 和 作为 Sigmoid 函 数 的 得 入 ， 从 
而 计算 出 每 个 神经 元 的 和 输出。 引用 参数 
vector<double> &output 十 网 络 的 输出 同 量 〈 所 有 和 输 
aa |+), HFIEF Ey 
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РЁ СаісшаѓіеОцрик ) 的 完整 实现 如 下 。 





bool CNeuralNet::CalculateOutput(vector<double> input, 
vector<double> &output) 


l 
得 入 不 相等 


if(input.size() != m_nInput) // 输 入 特征 问 量 维 数 与 网 络 


return false; 
int i, 3; 
double nInputSum; // 求 和 项 


// 计算 隐藏 层 输 出 


for(i=0; і<т pHiddenLyr->m nNeuron; i++) 


l 
nlnputSum = 0; 
// к 
for(j=0; j<m рніааепіуг- >т pNeurons[i].m nInput-1; 
ј++) 
l 


nInputSum += m pHiddenLyr->m pNeurons[i|.m pWeig 
hts[j]*(input[j]); 
J 


// 加 上 偏 移 项 
nInputSum += m pHiddenLyr->m pNeurons[i].m pWeight 
s[j]*BIAS; 


// ЗЕЯ РК НИН 
m pHiddenLyr->m pNeurons[i].m dActivation = Sigmoi 
d(nInputSum); 


// 计算 输出 层 输 出 


for(i=0; i<m_pOutLyr->m_nNeuron; і++) 


{ 

nlnputSum = 0; 

// к 

for(j=0; ј<т pOutLyr->m pNeurons[i].m nInput-1; j+ 
+) 

l 

nInputSum += m pOutLyr->m pNeurons[i].m pWeights 

[j] 


*m pHiddenLyr->m pNeurons[j].m dActivation; 


) 


// MEMEH 
nInputSum += m_pOutLyr->m_pNeurons[i].m_pWeights|[]J 
]*BIAS ; 


// 计算 S 函 数 的 输出 
m pOutLyr->m pNeurons[|i].m dActivation = Sigmoid(n 
InputSum); 


// ff 30 [А] 
output.push back(m pOutLyr->m pNeurons[i].m dActiv 
ation); 


} 


return true; 


FEDI ло ВУЛ [n] Er pe а СЕЗЕ Бе Н 
置 项 wo ， 其 系数 x0 即 为 BIAS， 本 而已 经 在 
neuralNet.h 中 将 其 定义 为 1。 


#define BIAS 1 // 偏 置 项 w8 的 系数 


(5) 训练 1 个 时 代 一 一 bool 
CNeuralNet::TraningEpoch 


该 方法 旦 反 同 传播 算法 的 核心 ， 负 贡 误 差 治 网 
络 的 反问 传播 。 对 于 一 个 给 定 的 训练 集 


TrainingEpochO 针 对 每 个 训练 样本 ， 调 用 
CalculateOutput( ) 计 算 其 实际 输出 ， 而 后 根据 实际 
输出 和 目标 输出 之 间 的 误 于 调整 输出 层 以 及 隐 马 层 
的 权 值 。 训 练 集 的 积 票 误 达 你 存在 双 精 上 度 类 成 员 莹 
ҥш аЕтогѕит н, 11528 Н Ж 00 2 55 
У ЕШ к ААЛ 


首先 注意 到 算法 的 两 个 vector<iovector> 关 型 的 
人 参数， 类 型 iovector 在 训练 数据 类 CNeuralData 头 文 
Амега 中 定义 如 下 。 


typedef vector<double> iovector; 


е У) АН хе ALIO Н] к, ЖН 
РРА ВЕ АЧ 147» ， 即 1 个 训练 样本 问 量 。 
vector<iovector> 进 一 步 定 义 了 1 个 同 量 的 同 量 ， 即 
一 个 样本 滤 隆 。 这 样 所 有 的 训练 数据 构成 一 个 样本 
起 阵 SetIn， 所 有 类 标 窒 经 过 编码 后 的 输出 问 量 构成 
一 个 输出 矩阵 SetOut。 


TrainingEpoch() 方 法 的 实现 如 下 。 





bool CNeuralNet::TrainingEpoch(vector<iovector>& SetIn, 
vector<iovector>& SetOut) 
{ 

int i, j, k; 

double WeightUpdate; // 权 值 更 新 量 


double err; // 误 差 项 


m dErrorSum = 0; // 1.128 

Ғог(1=0; i<SetIn.size(); i++) // 增 量 的 梯度 下 降 (针对 
每 个 训练 样本 更 新 权 值 》 

{ 


////////////////////////////// 

lovector vecOutputs; 

if(!CalculateOutput(SetIn[i], vecOutputs)) // 将 输 
入 沿 网 络 同 前 传播 

{ 


return false; 


} 
// 更 新 输出 层 权 重 


for(j=0; j<m_pOutLyr->m_nNeuron; j++) 


// 计算 误 委 项 
err = ((double)SetOut[|i][j] - vecOutputs[j])*vec 
Outputs[j]*(1-vecOutputs [j]); 
m pOutLyr->m pNeurons[j].m dError = err; // 记 录 
该 时 元 的 误 基 项 
m dErrorSum += ((double)SetOut[i][j] - vecOutput 
s[J])*((double)SetOut|[i] 
[j] - vecOutputs[j]); // 更 新 素 计 误 套 
// 更 新 每 个 输入 的 权重 
for(k=0; k<m pHiddenLyr->m nNeuron; k++) 
{ 
WeightUpdate = 
err*m аіеагпіпеКа+е*т pHiddenLyr->m pNeurons 
[k].m_dActivation; 


#ifdef NEED MOMENTUM 
// WAWEKE SE gr re 
m_pOutLyr->m_pNeurons[j].m_pWeights[k] += 
WeightUpdate+ m pOutLyr->m pNeurons[j].m_ p 


PrevUpdate[k |* MOMENTUM; 


m pOutLyr->m pNeurons[| j].m pPrevUpdate[k] = We 
ightUpdate; 
#else 

Г/Т pu y [El 

m pOutLyr->m pNeurons[| j].m pWeights[|k] += Weig 
htUpdate; 
#endif 


} 


// 俩 置 更 新 量 
WeightUpdate = err*m dLearningRate*BIAS; 


#ifdef NEED MOMENTUM 
// 市 有 冲 量 项 的 权 值 更 新 量 
m pOutLyr->m pNeurons[ j].m pWeights[k| += 
WeightUpdate + m pOutLyr->m pNeurons[j].m_ pP 
revUpdate| k | *МОМЕМТОМ; 
m pOutLyr->m pNeurons[| j].m pPrevUpdate[k] = Меір 
htUpdate; 
#else 
/ n E DH Н) E ЖТ 
m pOutLyr->m pNeurons[| j].m pWeights[|k] += Weight 
Update; 
#endif 
J 


// АМТ ЛК нї 


for(j=0; j<m_pHiddenLyr->m_nNeuron; ј++) 


err = ө; 
for(k=0; k<m_pOutLyr->m_nNeuron; k++) 
l 


err += m pOutLyr->m pNeurons[k|.m dError*m рои 


tLyr->m pNeurons|[k]. 
m _pWeights|[ j]; 


err *= m pHiddenLyr->m_pNeurons|j].m dActivation 
*(1-т pHiddenLyr-> 
m _pNeurons[j].m dActivation); 


// 更 新 每 个 输入 的 权重 
for(k=0; k<m pHiddenLyr->m_pNeurons[j].m_nInput- 
1; k++) 
l 
WeightUpdate = err*m dLearningRate*SetIn|[i][k | 


2 


#ifdef NEED МОМЕМТОМ 
// wA WEMAS E gr re 
m_pHiddenLyr->m_pNeurons[j].m_pWeights[k] += 
WeightUpdate + m_pHiddenLyr->m_pNeurons[j] 
.m_pPrevUpdate 
[k ]*MOMENTUM; 


m pHiddenLyr->m pNeurons[| j].m pPrevUpdate[k] = 
WeightUpdate; 
#else 

m pHiddenLyr->m pNeurons[| j].m pWeights[|k] += W 
eightUpdate; 
#endif 


J 
/ / a EJE 
WeightUpdate = err*m dLearningRate*BIAS,; 


#ifdef NEED MOMENTUM 
// 市 有 冲 量 项 的 权 值 更 新 量 
m_pHiddenLyr->m_pNeurons[j].m_pWeights[k] += 
WeightUpdate+m pHiddenLyr->m pNeurons[ j].m 


_pPrevUpdate [k |] * 
MOMENTUM; 


m pHiddenLyr->m pNeurons[| j].m pPrevUpdate[k] = 
WeightUpdate; 
#else 
/ / ж Н) SE 97 
m pHiddenLyr->m pNeurons[ j].m pWeights[|k] += Wei 
ghtUpdate; 
#endif 
J 


} 
m_nEpochs ++; // 时 代 计 数 +1 


return true; 


} 


算法 在 开始 时 将 时 代 的 素 积 误 震 m_dErrorSum 
清 0， 以 统计 每 一 个 时 代 的 素 积 误 基 ;而 后 对 于 训 
练 集中 的 每 一 个 样本 展开 循环 ， 如 对 于 第 i 个 样本 
SetIn[i ]， 以 之 作为 输入 沿 网 络 同 前 传播 ， 退 过 调 
用 方法 CalculateOutput(SetIn[i ], vecOutputs)， 计算 
出 网 络 输 出 ， 保 存 全 同 量 vecOutputs， 接 看 束 可 以 
根据 这 个 输出 与 第 i 个 样本 的 目标 输出 SetOut[i 12. 
屠 的 误 委 来 更 新 权 仁 。 对 于 输出 层 的 每 个 单元 )， 
ПАЗА Нег 〈 相 当 于 算法 15.3 中 6 ) ， 你 人 存 全 
相应 神经 元 的 成 员 变 量 m_pOutLyr- 
>m_pNeurons[j].m_dError 中 ， 并 且 更 新 素 计 误 关 
m_dErrorSum; 之 后 ， 对 于 单元 ) 的 每 一 个 输入 kk ， 


计算 出 权 全 更 新 星 WeightUpdate 〈 相 当 于 算法 15.3 
中 的 人 wx ) ， 最 终 分 成 带 有 冲 量 项 和 没有 冲 量 项 
两 种 情况 来 更 新 权 住 。 


对 于 隐藏 层 权 值 的 更 新 ， 大 体 结构 与 输出 层 一 
致 ， 对 照 算法 15.3 的 权 值 更 新 部 分 ， 读 者 应 该 很 容 
易 理解 ， 这 里 不 再 袭 述 。 


(6) 反 回 传播 算法 一 bool CNeuralNet::Train 


TrainingEpochO 方 法 只 进行 1 个 时 代 的 训练 。 由 
算法 15.3 可 知 ， 你 个 反 回 传播 算法 的 训 纤 过 程 需 要 
反复 调用 TrainingEpoch 函 数 ， 每 识 调用 结束 后 ， 运 
行 GetErrorSum( FR 25 |0 9125, Е) > НУ 
Мок L Ze АОС Е ҤЕ Н, KRN С ИП 
ЭИ Y (Trained) >. XA EERIE ER Ж ТЕЛУ 
n ЖЭ Train( ) 中 。 





bool CNeuralNet::Train(vector<iovector>& SetIn, vector< 
lovector>& SetOut) 


l 


m_bStop = FALSE; // 是 合 要 中 途 俘 止 训练 
CString strOutMsg; // 输 出 信息 


do 
// 训 练 一 个 时 代 


if(!TrainingEpoch(SetIn, SetOut)) 
{ 


strOutMsg.Format(" 训 练 在 第 %d 个 时 代 出 现 错误 ! ", Get 


Epoch()); 
AfxMessageBox(strOutMsg); 


return false; 


} 


// 计 算 1 个 时 代 的 平均 到 每 1 次 训练 、 每 个 输出 的 错误 
m dErr = GetErrorSum() / ( GetNumOutput() * SetIn. 
size() ); 


if(m dErr < m аміпЕггог) 
break; //1 9% 
т vecError.push back(m dErr); // 记 录 各 个 时 代 的 错误 
， 以 备 训练 结束 后 绘制 训练 误差 曲线 


WaitForIdle();// 在 循环 中 蜀 集 下 来 以 检查 是 否 有 用 户 动 作 
和 消 晨 ， 主 要 为 了 让 训练 可 以 在 中 途 集 止 
if(m_bStop) // 检 查 停止 标志 
ргеак; 


} 
while(m nMaxEpoch-- > 0); 


return true; 


上 述 程序 中 的 下 列 语句 用 于 计算 1 个 时 代 的 平 
均 到 每 1 次 训练 、 每 个 输出 的 训练 误差 。 


m dErr = GetErrorSum() / ( GetNumOutput() * SetIn.size( 


) ); 





在 每 个 时 代 训 练 结束 的 时 候 ， 程 序 检查 这 个 误 
А418 т АЕ, Il T Ti r ЛЕ RE JI UI 2k 
到 此 络 


操作 者 希望 这 个 误 甜 可 以 各 观 反 映 网 络 训练 的 
进程 ， 而 直接 通过 m_pNet->GetErrorSum0O 取 得 的 时 
代 的 累计 输出 平方 误差 是 对 所 有 训练 样本 和 所 有 输 
出 单元 求 和 得 到 的 ， 与 训练 样本 和 输出 单元 的 数目 
有 关 。 由 于 不 同 的 问题 对 应 网 络 的 输出 层 蛙 元 数目 
可 能 相 于 很 大 ， 束 古 同一 个 问题 也 会 因为 输出 层 编 
码 方式 的 不 同 而 产生 不 同 的 输出 层 单 元 数目 ， 况 是 
每 次 训练 网 络 的 样本 数目 也 不 一 样 ， 因 此 采用 了 输 
出 单元 的 数目 与 训练 样本 数目 去 除 总 的 误 乔 得 到 的 
平均 误差 来 衡量 当前 网 络 与 训练 样本 的 拟 和 程度 。 


此 外 ， 由 于 输出 经 过 了 Sigmoid 函 数 的 激励 ， 
应 该 是 一 个 大 于 0、 小 于 1 的 值 ， 而 目标 输出 为 0 或 
1 〈 程 序 中 实际 取 0.1 或 0.9， 详 见 15.3.3 小 节 ) ， 
此 这 个 平均 的 平方 误差 值 mn_dErr 也 应 该 是 大 于 0、 
小 于 1 的 。 


(7) 识别 一 int CNeuralNet::Recognize 


该 方法 谈 入 由 参数 strPathName 指 定 的 待 识别 图 
像 文 件 ， 做 出 分 类 决策 并 返回 类 别 标 号 。 参 数 rt 是 
一 个 与 图 像 等 大 的 CRect 对 象 ，3 引 入 它 主 要 是 为 了 


方便 和 图 像 重 采样 相关 的 操作 ， 双 精度 引用 型 参数 
dConfidence 用 于 将 网 络 的 最 大 输出 与 次 大 输出 之 天 
WE, IAA ETER En MANERA 

的 置信 和 度 〈 参 见 15.3.3 小 节 )〉 。 正 和 常情 况 下 函数 返 

加 识别 出 的 样本 类 别 标 配 ， 如 果 人 返回 -1 则 表示 识别 
过 程 中 发 生 了 错误 。 


下 面 给 出 Recognize( ) 函 数 的 完整 实现 。 


int CNeuralNet::Recognize(CString strPathName, CRect rt 
, double &dConfidence) 
l 

int nBestMatch; // 类 别 标号 

double dMaxOut1 = 0; // 最 大 输出 

double dMaxOut2 = 0; // 次 大 输出 


// 谈 入 竺 识别 图 像 文件 

CGray gray; 

if(!gray.AttachFromFile(strPathName)) 
return -1; 


/ /® ТАЯКЕ а ш J zÀ 
vector<double> vecToRec; 
for(int j=rt.top; j<rt.bottom; j+= КЕЅАМРІЕ ГЕМ) 


for(int i=rt.left; i<rt.right; i+= КЕЅАМРІЕ LEN) 


l 
int nGray = 0; 
for(int mm=j; mm<j+RESAMPLE LEN; mm++) 


for(int nn=i; nn<i+RESAMPLE_LEN; nn++) 
nGray += gray.GetGray(nn, mm); 


} 
nGray /= КЕЅАМРІЕ ГЕМҒКЕЅАМРІЕ LEN; 


vecToRec.push_back(nGray/255.0); 


} 
} 
// 计 算 网 络 输出 


vector<double> outputs; // 输 出 同 量 
if(!CalculateOutput(vecToRec, outputs)) 


l 


AfxMessageBox("rec failed"); 
return -1; 


) 


// 寻 找 最 大 啊 应 的 的 输出 单元 ,对 应 的 单元 号 即位 类 别 
nBestMatch = 0; 
for (int i=0; i<outputs.size(); ++i) 


if (outputs[i] > dMaxOut1) 

{ 
dMaxOut2 = аМахои+1; 
dMaxOut1 = outputs[i]; // 记 录 最 大 的 输出 单元 值 
nBestMatch = i; 

J 


} 
dConfidence = dMaxOutl - dMaxOut2; // 计 算 置 信 度 


return nBestMatch; // 返 回 识 别 结 果 (2SA =) 


(8) 保存 训练 成 果 一 bool 


CNeuralNet::SaveToFile 


ТРКУ H] F 2# ж ло Н REA 
ЛНУ Н. UARA, WAEA 2 {в 
MAF- MAREA ЖЇР (®.пег М) 。const сһаг* 
型 参数 lpszFileName 指 出 了 训练 配置 文件 的 存储 路 
£; bool 型 参数 bCreate 为 true 表 示 需 要 新 建 配 置 文 
F EU AEDE LF H) H o 


下 面 给 出 Save То File0 AA TK. 
bool CNeuralNet::SaveToFile(const char* lpszFileName, b 
ool bCreate) 


CFile file; 
if( bCreate ) // J ERI 


if(!file.Open(1pszFileName, CFile::modeWrite|CFile 
: :modeCreate ) ) 
return false; 


} 
else// 进 加 模式 
{ 


if(!file.Open(lpszFileName, CFile::modeWrite)) 
return false; 


file.SeekToEnd(); // 退 加 与 入 到 末尾 
J 


// 写 入 网 络 头 信息 
NEURALNET HEADER header = ( Ө }; 
header.dwVersion = NEURALNET VERSION; 


header.m_nInput = m піІпри+; 
header.m_nNeuronsPerLyr = m_nNeuronsPerLyr; 
header.m nOutput = m nOutput; 
header.m_nEpochs = m_nEpochs; 
file.Write(&header, sizeof(header)); 


/ /® МАЕ А 
file.Write(&m_dErr, sizeof(m_dErr)); 


int i, J; 
// 写 入 权 值 信息 
for(i=0; і<т pHiddenLyr->m nNeuron; i++) 
{ / /bay l; IB 
file.Write(&m pHiddenLyr->m pNeurons[i].m dActivat 
ion, 
sizeof(m pHiddenLyr->m pNeurons[i].m dActivation 


)); 
file.Write(&m pHiddenLyr->m pNeurons[i].m dError, 
sizeof(m рніаадепіуг- >т pNeurons[i].m_dError)); 
for(j=0; j<m рніааепіуг- >т pNeurons[i].m nInput; j 
++) 
l 
file.Write(&m pHiddenLyr->m pNeurons[i].m pWeigh 
ts[j], 
sizeof(m pHiddenLyr->m pNeurons[i].m pWeights[ 
j])); 
J 
J 
for(i=0; i<m pOutLyr->m nNeuron; i++) 
{ / / Н ЖЕН 


file.Write(&m pOutLyr->m pNeurons[i].m dActivation 


sizeof(m pOutLyr->m pNeurons[i].m dActivation)); 
file.Write(&m pOutLyr->m рМеигопѕ [1] .т dError, 


sizeof(m_pOutLyr->m_pNeurons[i].m_dError)); 
for(j=0; j<m_pOutLyr->m_pNeurons[i].m_nInput; j++) 


file.Write(&m pOutLyr->m рМеигопѕ[1].т pWeights[ 
sizeof(m pOutLyr->m pNeurons[i].m pWeights[j]) 


} 
} 


Ғі1е.С1оѕе(); 
return true; 


(9) 载 入 训练 成 果 一 bool CNeuralNet:: 
Г оааЕготЕ1е 


РЁ 5 pi ЛІрѕ2ЕПеМате2: 519 xE ВІ 200 
вй (* пе) 中 载 入 网 络 各 层 单 元 数目 等 基 
训 构 信息 及 训练 时 代数 目 、 训 练 误 过、 网 络 权 值 
等 训练 信息 。DWORD 型 参数 dwStartPos 表 示 文 件 
读 取 的 开始 位 置 ， 该 函数 的 完整 实现 如 下 。 





bool CNeuralNet::LoadFromFile(const char* lpszFileName, 
DWORD dwStartPos) 


CFile file; 
if(!file.Open(lpszFileName, CFile::modeRead)) 
return false; 


file.Seek(dwStartPos, СЕі1е: :begin);// 定 位 到 dwStartP 


os 指出 的 开始 位 置 


// 读 入 网 络 头 信息 
NEURALNET HEADER header = { Ө }; 
if(file.Read(&header, sizeof(header)) != sizeof(hea 
der )) 
return false; 
// 校 验 版 本 
if(header.dwVersion != NEURALNET VERSION) 
return false; 
// 校 验 网 络 基 本 结构 
if(m_nInput != header.m nInput 
|| m nNeuronsPerLyr != header.m nNeuronsPerLyr 
|| m_nOutput != header.m nOutput) 
return false; 


m пЕросһѕ = header.m nEpochs; // 更 新 训练 时 代数 目 
file.Read(&m dErr ，sizeof(m dErr));// 读 入 训练 误差 信 


s! 
int i, J; 
// 读 入 网 络 权 值 
for(i=0; і<т pHiddenLyr->m nNeuron; i++) 
{ / / bak Ja 
file.Read(&m pHiddenLyr->m pNeurons[i].m dActivati 
on, 
sizeof(m рНіааепіуг- >т pNeurons[i].m dActivation 
)); 
file.Read(&m pHiddenLyr->m pNeurons[i].m dError, 
sizeof(m pHiddenLyr->m pNeurons[i].m dError)); 
for(j=0; j<m_pHiddenLyr->m_pNeurons[i].m_nInput; j 
++) 


file.Read(&m pHiddenLyr->m pNeurons[i].m pWeight 
s[j], 


sizeof(m рніаадепіуг- >т _pNeurons[i].m pWeights[ 


j 1)); 
} 
} 


for(i=0; і<т pOutLyr->m nNeuron; i++) 
{// 输 出 层 
file.Read(&m pOutLyr->m pNeurons[i].m dActivation, 
sizeof(m pOutLyr->m pNeurons[i].m dActivation)); 
file.Read(&m pOutLyr->m pNeurons[i].m_dError, 
sijzeof(m pOutLyr->m pNeurons[i].m dError)); 
for(j=0; j<m pOutLyr->m pNeurons[i].m nInput; j++) 


file.Read(&m pOutLyr->m pNeurons[i].m pWeights|jJ 


sizeof(m pOutLyr->m pNeurons[i].m pWeights[j]) 


); 
} 
} 
Ғі1е.С1оѕе(); 
return true; 
J 


15.4.5 ”神经 网 络 的 训练 数据 类 一 
CNeuralData 


CNeuralData 类 主要 人 负 贡 为 神经 网 络 医 得 训练 
数据 相关 的 信息 ， 包 括 训练 样本 窍 阵 和 对 应 的 输出 
аја. ЯНАИ. НРО 
FAKER ТРА ТЕНИ НАР {БЛ 


完整 的 CNeuralData 类 定义 如 下 ， 它 位 于 
DigitRec 工 程 的 neuralData.h 头 文件 中 。 


class CNeuralData // 训练 数据 类 
{ 
public: 

CNeuralData( ) ; 

virtual ~CNeuralData(); 


void Init(CRect rt, int nInputs); // 基 本 的 初始 化 

void С1еаг(); // i VJ 8% 

void GetClassInfoFromDir(CString strDir); // 根 据 strD 
ir 中 的 分 类 目录 信息 获得 训练 数据 所 在 目录 和 和 类 列 名 称 信息 

// 洪 加 训练 数据 所 在 目录 和 类 别名 称 信息 

bool AddData(CString strImgDir, CString strClassNam 
e); 

// 取 得 输入 训练 样本 矩阵 

vector<vector<double> >& GetInputSet( ); 

// 取 得 得 出 同 量 定 阵 

vector<vector<double> >& GetOutputSet(); 


// 取 得 训练 集合 以 及 训练 样本 的 存 取 路 径 

bool CreateTrainingSetFromData(); 

bool GetTrainingSet(); // 151129, Cñ Л 
样本 是 阵 和 设 定 输出 类 编码 

bool GetSamplePaths(); // 取 得 训练 样本 的 存 取 路 径 ， 将 这 
些 信息 存放 至 m_vecSamples 


vector<CString> GetVecClassNames() í return т vecCl 
assNames; } 


// 返 回 类 别名 称 
CString GetClassName(int nClass); 
/ NBX KJA Z 


int GetClassNum() í return т пС1аѕ5; } 


// 返 回 得 入 单元 数目 
int GetInputNum() í return m_nInputs; } 
protected: 
vector<CString> m vecClassNames; // 类 别名 称 ( 存 放 该 类 
标本 的 文件 夹 名 称 ) 


vector<CString> m vecDirs; // 存 放 训 练 样本 的 类 别 目 录 
vector<vector<CString> > m vecSamples; // 训 练 样本 文件 
的 存 取 路 径 


// 包含 训练 数据 
vector<iovector > m SetOut; // 输 出 问 量 矩阵 
vector<iovector > m SetIn; // 输 入 样本 问 量 矩阵 


int m_nClass; // 类 别 数 日 

CRect m_rt; // 每 个 图 像 的 处 理 区 域 

int т nInputs; // Лл H (38) AX [n] r 28%) 
}; 


№ тА К. 


(1) m_Ssetm 为 训练 样本 定 阵 ，m_SetOut 为 对 
应 的 输出 问 量 和 矩阵。 之 前 曾 在 CNeuralNet:: 
TrainingEpoch( ) 中 接触 过 这 两 个 ijovector 型 器 量 ， 实 
际 上 对 于 第 i 个 训练 样本 ， 其 输入 问 量 为 m_SetIn[i 
]， 对 应 的 经 过 编 枉 的 输出 同 量 为 m_SetOut[i ]。 


(2) 类 成 员 m vecClassNames 用 于 保存 类 别名 
称 ， 程 序 中 以 存放 诅 英 样本 的 文件 夹 名 称 作 为 诅 葡 
的 类 别名 称 。 


(3) m_vecDirs 用 于 存放 训练 样本 类 别 目 录 的 


路 径 信 息 。 


(4) m_vecSamples 则 用 于 你 存 训 练 样 本 文件 
的 存 取 路 径 。 


(5) m_nClass 表 示 类 别 数 目 。 


(6) m_nimputs 为 输入 单元 数目 (输入 回 量 维 
效 )。 


(7) Crect 对 象 m_rt 对 应 于 每 个 图 像 的 处 理 区 
域 ， 这 样 束 可 以 方便 地 对 样本 图 像 的 任何 感 兴趣 的 
区 域 进 行 处 理 。 


ERRAK PA ЖИП F o 


在 CNeuralData 的 商定 义 中 已 经 给 出 了 一 部 分 
方法 的 实现 细 方 ， 其 他 类 成 员 函 数 的 实现 位 于 
NeuralData.cpp 文 件 中 。 


国 数 GetInputSet0 和 GetOutputSet() 分 别 返 回答 
NIAE RKE kEm Setini E o EE RE 
m_SetOut, GetClassName(int nClass) н] 以 返回 第 
nClass WAZA. mit GetClassNum( Ji% [H| ZŠ 
ЯН) 6, ЕКЕ ТА ЕВ» КЕ А 
CNeuralData 的 其 他 几 个 主要 方法 。 


(1) 基本 初始 化 一 void CNeuralData::Init 


该 方法 完成 基本 信息 的 和 初始化， 包括 清空 各 个 
з, ВЕ ЧИ КАЈА ЈЕ [х Em гет ЛА В. лс 
Н.т пїприіѕ, F# HKHK J A Н m_nClass & 2. 


void CNeuralData::Init(CRect гі, int nInputs ) 
{ 


m_rt = rt; // 设 定 处 理 范 围 定形 
т SetOut.clear(); 
т Ѕеёїп.с1еаг(); 


С1еаг(); / ATANI 


m_nInputs = nInputs; // 设 定 输入 数目 





其 中 调用 的 Clear() 函 数 原 型 如 下 。 


void CNeuralData::Clear() 
{ 
т месрімѕ.с1еаг(); 
т мессЈјаѕѕМатеѕ.сЈеаг(); 
т месѕатр1еѕ.с1еаг(); 


m _nClass 


} 





(2) 添加 类 别 信息 一 bool 
CNeuralData::AddData 


该 方法 将 参数 stImgDir 提 供 的 训练 数据 的 类 别 
Н х5 9914] С5ігіпе |а] етт уесрігѕ'", 
strImgDir[i ] 用 于 保存 第 i 类 样本 所 在 的 类 别 目录 的 
跤 人 笃信 息 〈 数 据 集 中 的 每 类 样本 你 存在 1 个 文件 
3), 同时 ， 将 参数 strClassName 提 供 的 训练 数据 
类 别名 称 信 息 〈 访 类 样本 所 在 的 目录 名 称 〉 洪 加 到 
CString 型 同 量 m_vecClassNames 中 。 该 函数 的 完整 
实现 如 下 。 


bool CNeuralData::AddData(CString strIimgDir, CString st 
rClassName) 


// 添 加 样本 文件 所 在 目录 的 路 径 信息 


m vecDirs.push back(strImgDir); 


// 洪 加 代表 各 个 类 的 名 字 ， 我 们 以 存放 该 类 的 文件 夹 的 名 字 作 为 
类 的 名 字 
m vecClassNames.push_back(strClassName); 


m nClass ++; // 类 别 数 目 
return true; 


) 





(3) 取得 样本 的 存 取 路 径 并 载 入 训练 集合 


bool CNeuralData::CreateTrainingSetFromData 





作为 CNeuralData 类 有 的 主要 方法 ， 
CreateTrainingSetFromData( ) 取 得 训练 样本 的 存 取 
路 径 进 而 载 入 整个 训练 集合 。 这 两 个 主要 功能 是 分 


DNAN YH GetSamplePaths( ) 与 GetTrainingSet( ) 77 
法 来 实现 的 ， 稍 后 将 分 别 介绍 ， 


bool CNeuralData::CreateTrainingSetFromData( ) 


/ / ЯЕ АНУ РА 
if(GetSamplePaths() == false) 
return false; 


// 取 得 整个 训练 集 


if( !GetTrainingSet() ) 
return false; 


return true; 


) 





(4) 取得 训练 样本 的 存 取 路 径 一 -bool 
CNeuralData::GetSamplePaths 


在 AddData0) 方 法 中 已 经 得 到 了 类 别 目录 信息 
m_vecDirs， 根 据 此 信息 过 历 第 i 2291] Н ж, пр 
一 步 获得 该 类 训练 样本 文件 的 存 取 路 和 任 ， 并 依 座 你 
人 存 至 vector<vector<CString>> 型 成 员 m_vecSamples 
中 ， 其 中 m_vecSamples[i ][j H FRF Ri 类 的 第 ] 
个 训练 样本 文件 的 存 取 路 径 。 充 函数 的 完整 实现 如 
下 


bool CNeuralData::GetSamplePaths() 
{ 


int nClass = m_vecDirs.size(); // 类 别 数 目 


for(int i=0; i<nClass; 1++) 
{ 
// і) 9512251] Н, ЕА ЕАУ м 
ecFiles 
vector<CString> vecFiles; // 荣 一 类 训练 样本 的 存 取 路 径 


// 合 找 日 标 为 第 i 类 类 列 日 录 下 的 全 部 .bmp 图 像 文件 
CString strToFind = m_vecDirs[i]; 
strToFind += "*.bmp"; 


WIN32 FIND DATA findData; 

HANDLE hFindFile; 

CString strSamplePath; // “ИА 1 
hFindFile = ::FindFirstFile(strToFind, &findData); 
if(hFindFile != INVALID HANDLE VALUE) 


{ 
do 


{ 
if(findData.cFileName[0] == '.') 
continue; 


if(!(findData.dwFileAttributes & FILE ATTRIBUT 
Е РІКЕСТОКҮ)) 
{ 
strSamplePath = m vecDirs[i]; // 取 得 类 别 日 录 
strSamplePath += findData.cFileName; // 取 得 完 
整 存 取 路 径 
vecFiles.push_back(strSamplePath); // 添 加 到 ve 
cFiles 


} 
while(::FindNextFile(hFindFile, &findData)); 


::FindClose(hFindFile); 
J 


else 


{ 
AfxMessageBox(" 没 有 找到 训练 样本 图 像 文 件 ， 请 检查 训练 


样本 目录 十 个 正确 1 ) ; 
return false; 


} 


if(vecFiles.size() == 6)// ŠJ Н з 
return false; 


m месѕатр1еѕ.риѕћ баск(месЕі1еѕ); // 加 入 该 类 训练 文 
件 的 存 取 路 径 同 量 到 全 部 训练 样本 的 同 量 
J 


return true; 


) 


(5) 取得 整个 训练 集 一 -bool 
CNeuralData::GetTrainingSet 


该 方法 根据 m_vecSamples 中 保存 的 路 径 信 息 读 
入 训练 样本 图 像 ， 将 图 像 数 据 按 行 存储 为 同 量 ， 你 
Af 238) ЛАРА т Setin, m_Setln[m ][n ] 中 存储 
看 第 m “А [=] ж 55 维 信息 ; 与 此 同时 ， 
设置 对 应 的 输出 向 量 m_SetOut， 程 序 中 采用 的 是 1 
of n 的 输出 层 编码 方案 〈 人 参见 15.3.3 小 节 ) ， 因 此 
对 于 第 i 类 样本 ， 将 对 应 输出 同 量 的 第 i 维 置 为 局 值 
0.9， 其 余 各 维 均 为 低 值 0.1， 相 应 代码 实现 如 下 。 


// 为 第 i 类 训练 样本 设 定 输出 回 量 


vector<double> outputs(nClass, 0.1); 


outputs[i] = 0.9; 





GetTrainingSet() 函 数 的 完整 实现 如 下 。 


bool CNeuralData::GetTrainingSet() 


{ 

/ /ї& 2) A FE Е Г ЖШ rH ТА] = [Е 

m SetIn.clear(); 

m _SetOut.clear(); 

vector<double> vecInputs(m_nInputs, ©); // 输 入 样本 问 
量 


СОСАІтареРгосеѕ5 ocrImg; //0OCR 图 像 处 理 对 象 
int nClass = m vecDirs.size(); // 取 得 类 别 数目 


// 谈 入 每 一 类 的 训练 样本 图 像 ， 转 化 为 输入 回 量 的 形势 ; 设 冠 
对 应 的 类 标签 并 编码 为 输出 同 量 


for(int i=0; i<nClass; i++) 


{ 
int nSplInClass = m месѕатр1еѕ[1].5іғе(); // 访 类 样 


WA H 
// 为 第 i 类 训练 样本 设 定 输出 同 量 
vector<double> outputs(nClass, 0.1); 
outputs[i] = 0.9; 
for(int j=0; j<nSplInClass; j++) 


// 设 定 第 i 关 第 j 个 样本 的 和 输出 同 量 
m SetOut.push back(outputs); 


// 设 定 第 i 关 第 j 个 样本 的 输入 同 量 
if(!ocrImg.AttachFromFile(m vecSamples[i][j])) 
{ 

CString strOut; 

strout.Format(" 谈 入 训练 样本 图 像 %s 时 及 生 错误 已 ，m 

_vecSamples[ i][j]); 
AfxMessageBox(strOut); 
continue; 


} 


int nDim=0; // 输 入 癌 量 的 当前 维 
int mm, nn; 


// 样 本 尺寸 校 验 
if( (ocrIimg.GetHeight() != m rt.bottom) || (осгІ 
mg .GetWidthPixel() != m rt. 
right) ) 
{ 
AfXxMessageBox(" 图 像 大 小 与 预 设 定 值 不 符 ! 请 重新 设 定 D 
igitRec.h 中 的 IMG_HEIGHT 
和 IMG WIDTG。"); 
return false; 


) 


/ BR EKE FIIT F 16 ЛИЕ] ж 
for(int ii=m rt.top; ii<m_rt.bottom; ii+=RESAMPL 
E LEN) 
{ 
for(int jj=m rt.left; jj<m_rt.right; jj+=RESAM 
PLE LEN) 
{ 
int nGray = 0; 
for(mm=ii; mm<ii+RESAMPLE LEN; mm++) 
{ 
for(nn=jj; nn<jj+RESAMPLE LEN; nn++) 
nGray += ocrImg.GetGray(nn, mm); 


) 
nGray /= RESAMPLE LEN*RESAMPLE LEN; 


уесІприїѕ [пріт] = (double)nGray/255.80; 


nDim ++; 
}// for jj 
}// for ii 


// 设 定 第 i 基 第 j 个 样本 的 输入 同 量 
m SetIn.push баск(месІпри+ѕ); 


y// for j 
y // for i 


return true; 


注意 到 程序 中 使 用 的 图 像 处 理 类 为 COCRImage 
Process, MAEA А ҢЈСітергосеѕѕ, 2х E 2 
征 为 了 满足 系统 扩展 性 的 要 求 。COCRImageProcess 
征 CImgProcess 的 派生 类 ， 加 入 了 专门 针对 字符 疼 
像 的 图 像 处 理 功能 ， 详 见 15.6-。 





训 敌 误差 随时 间 的 变 尼 RPI: 1989, 1=3E:D.D033T9 
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15.4.6 1R Æ R 526 —СУајиеТгаск 


CValueTrack 86 9 22 111926 АЧУ А, 
曲线 ， 如 图 15.15 所 示 。 


完整 的 CValueTrack 类 定义 如 下 ， 它 位 于 
DigitRec 工 程 的 ValueTrack.h 头 文件 中 。 





class CValueTrack 

{ 

public: 
CValueTrack(CWnd *pWnd); 
virtual ~CValueTrack(); 


void AddValue(double val); 
void Draw(); 
void Init() 
{ 
m_nValue = Ө; 


} 


CWnd *т pwnd; // 绘 图 窗 体 

CRect m_rt; //2: ХЕ 

int m_nMaxValues; // 绘 图 区 能 容纳 的 最 大 误 帮 值 个 数 
double *m pValues; // 误 差 值 数组 

double *m_pTemp; // 临 时 误差 信 数 组 

int m_nValue; // 26 lB 51| 


private: 
// 绘制 相关 的 操作 对 象 
CBrush т GroundBush ; 
CBrush m SelectBrush; 
CPen m WavePen; 
CPen m CoordinatePen; 
CPen m ProcesslinePen; 
CPen m LabelPen; 
СРеп m LabewavePen; 
СРеп m РгоегатРеп; 


J; 


№ тА F < 


(1) CWnd 型 变量 m_pWnd 是 指向 绘图 窗 体 的 
指针 。 


(2) m_rt 为 代表 整个 误 兰 变化 曲线 绘图 区 的 
ЖЖ. 


(3) 双 精 度 型 变量 m_pValues 是 误差 值 动态 数 
组 ， 其 下 标 对 应 于 误 兰 曲线 图 的 横 坐 标 〈 时 间 


TD , 5287618 07И B НК АМН. 


(4) m_pTemp 有 是 临时 的 误 午 值 动态 数组 ， 用 
于 在 某 些 操作 中 临时 休 存 m_pValues 的 值 。 


(5) m_nMaxValues 是 误差 值 动态 数组 
m_pValues 的 维 数 。 由 于 绘图 区 大 小 有 限 ， 仪 能 容 
纳 有 限 长 眼 的 误 开 曲线 ，m_nMaxValues 对 应 于 绘 
图 区 所 能 容纳 的 误 开 值 个 数 。 


(6) m nValue t і 2/18 28 8) 51, 
m_pValues[m_nValue] 表 示 当 前 要 绘制 的 误 闫 值 。 


重要 类 成 员 函 数 如 下 。 
(1) 加 入 当前 误 雪 一 CValueTrack::AddValue 


该 冰 数 在 m_pValues 数 组 中 加 入 当前 的 谋 甜 信 
县 。 如 果 当 前 误差 值 索 引 m_nValue 已 经 大 于 等 于 绘 
多 区 所 能 容纳 的 误差 值 个 数 m_nMaxValues， 则 表 
示 整 个 绘图 区 已 被 误 兰 曲线 占据 。 此 时 需要 将 误 产 
曲线 整体 前 移 1 个 位 置 ， 以 便 在 最 后 的 位 置 加 入 当 
有 的 误 和 大 值 。 访 函数 的 完整 实现 如 下 。 





void CValueTrack::AddValue(double val) 
l 


if(m_nValue >= m_nMaxValues) // 当 前 绘图 区 已 满 


// 整体 前 移 1 位 

memcpy(m pTemp, т pValues + 1, sizeof(double)*(m п 
MaxValues-1)); 

m рТетр[т nMaxValues-1] = val; // 当 前 误差 放 入 最 后 位 


memcpy(m_pValues, m_pTemp, sizeof(double)*(m nMaxV 
alues)); 


else 


m pValues[m_nValue++] = val;// 加 入 当前 误差 
J 


(2) Ak ZA M H 2Z&——CvValueTrack::Draw 


А08 0 ат рМашеѕ AAEE TE 黑 背 景 
当中 绘制 绿色 的 误 兰 曲线 。 注 意 为 了 观 穴 误 震 的 细 
微 变 换 ， 纵 轴 “误差 值 ) 采用 了 非 均 匀 的 刻度 。 





void CValueTrack: :Draw( ) 
l 


CRect Rect; 
m_pWnd->GetClientRect(&Rect); 
CDC *pDC = m_pWnd->GetDC(); 


int nBaseX = 25; 
int nWaveY = Rect.Height() - 10; 


HGDIOBJ pOldBrush = pDC->SelectObject(m GroundBush ) 


绘制 黑色 背景 


у: 


pDC->Rectangle(&Rect); 


HGDIOBJ pOldPen = pDC->SelectObject(m CoordinatePen 


// 绘制 横 癌 坐标 轴 
pDC->MoveTo(nBaseX, nWaveY); 
pDC->LineTo(Rect.Width(), nWaveY); 


// 绘制 纵 同 坐标 轴 
pDC->MoveTo(nBaseX, nWaveY); 
pDC->LineTo(nBaseX, 0); 


// 绘制 时 间 刻 度 
int nXOrg = 0; 
int nPixelsPerUnit = 50; 


// 绘制 横 轴 刻度 
CString str; 
int nRng = Rect.Width(); 


for(int i=nBaseX; i<=nRng; i++) 
if((i-nBaseX) % nPixelsPerUnit == 0) 


l 
// 刻度 
pDC->MoveTo(i, nWaveY); 
pDC->LineTo(i, nWaveY - 5); 
J 
J 


// 绘 制 纵 轴 刻度 

nRng = nWaveY; 

int nn = 0; 

double dRule = 0; //Ж2Ї{Н © 0.001 0.01 0.1 1 
int ySpan = nRng/4 - 5; // 计 算 纵 轴 刻 度 间 长 度 


B); 


pDC->SetBkColor (GROUND КОВ); 
pDC->SetTextColor(COPEN RGB); 
for(i=nRng; i>=0; i--, nn++) 
{ 

1ғ( (пп) % ySpan == Ө) 


// 2E 
pDC->MoveTo(nBaseX, i); 
pDC->LineTo(nBaseX + 7, i); 
if(dRule == 0.001) 
str.Format("%.3f",dRule); 
else if (dRule == 0.01) 
str.Format("%.2f",dRule); 
else 
str.Format("%.1f",dRule); 
if(dRule == 0) 
dRule = 0.001; 
else 
dRule *= 10; 


pDC->TextOut(nBaseX - 25, i-8, str); 


} 
} 


/////////// т ////////// 
pDC->SelectObject(m WavePen); 
if(m nValue > 0) 

pDC->MoveTo(nBaseX, nRng - 3*ySpan); 
for(i=0; i<m nValue; i++) 
l 

if(m_pValues[i] <= 0.001) // 0.0001 - 0.001 


dRule = m _pValues[i]/(0.001/ySpan); 
pDC->SetPixel(i+nBaseX, nRng - dRule, WAVEPEN RG 


else if(m pValues[i] <= 0.01) // 0.001 - 0.01 


{ 
dRule = m руа1иеѕ[1 |/(0.01/уѕрап); 
pDC->SetPixel(i+nBaseX, nRng - (dRule + уѕрап), 
WAVEPEN RGB); 


else if(m pValues[i] <= 0.1)// 0.01 - 0.1 


dRule = m _pValues[i]/(0.1/ySpan); 
pDC->SetPixel(i+nBaseX, nRng - (dRule + ySpan*2) 
‚ WAVEPEN_RGB); 


else if(m pValues[i] <= 1)// 0.1 - 1 


dRule = m pValues[i]/(1.0/ySpan); 
pDC->SetPixel(i+nBaseX, nRng - (dRule + ySpan*3) 
‚ WAVEPEN_RGB); 


} 
} 


pDC->SelectObject(pOldPen); 
pDC->SelectObject(pOldBrush); 
т _pWnd->ReleaseDC(pDC); 


15.4.7 训练 对 话 人 性 尖 一 CTrainDlg 


训练 对 话 框 类 CTrainDlg 人 负责 页 与 训练 有 天 有 的 充 
置 ， 训 练 过 程 的 司 动 、 仿 止 ， 训练 震 集 的 保存 等 
= Еа €J 括 误差 曲线 在 内 的 训练 信息 的 实 
时 更 新 。 


处 在 训练 状态 中 的 训练 对 话 框 如 图 15.16 所 示 。 
CTrainDlg 类 有 的 部 分 数据 成 员 如 下 所 示 。 
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ВН: 1959, 1532.0. 003379 





ШЕЕ. РАЕВА, 


415.16 ”训练 对 话 框 (训练 中 ) 


UINT m_nTimer; // 定 时 右 ID 

CRect m_rt; // 图 像 处 理 的 矩形 区 域 
CNeuralNet *m pNet; // 神 经 网 络 对 象 
CNeuralData m_data; // 神 经 网 络 的 数据 对 象 


BOOL m_bStop; // 俘 止 训练 标志 

CString strDirTrain; // 训 练 样本 分 类 目录 
CValueTrack *m pTrack; // 用 于 误差 跟踪 的 对 象 
BOOL m bInTraining; // 是 个 处 于 训练 中 





CTrainD1g 关 的 部 分 重要 成 员 函 数 识 明 如 下 。 





(1) Ж CTrainDlg::OnButtonTrain 


单 击 训练 对 话 框 上 的 “训练 ? 控 钮 ， 触 发 


ОпВиќопТгаіп() 4 0, 1035 H Г вх HJ U| ZE 
ЉЭ т рМ№ег. UAF R PZB A ЖЛЕ Е 
ДУ Юаш УЕ (лег), WRZE LOA 
在 ， 则 程序 将 谈 取 已 有 配置 文件 中 的 信息 ， 从 上 一 
次 训练 俘 止 的 时 代 继 续 训 练 ， 如 条 指定 的 是 一 个 新 
的 配置 文件 ， 则 开始 一 次 新 的 训练 。 每 次 训 练 结 

时 ， 程 序 都 会 将 训练 成 采 傈 存 全 训练 配置 文件 中 。 


下 面 给 出 OnButtonTrain0 函 数 的 完整 实现 。 


void CTrainDlg::OnButtonTrain() 


// 更 新 UI 状 态 

( (CButton* )GetD1gItem(ID BUTTON TRAIN) )->EnableW 
indow(false); 

( (CButton* )GetD1gItem(ID BUTTON STOP) )->EnableWi 
ndow(true); 

EnableControls(false); 


int nOuputs = m data.GetClassNum(); // 输 出 单元 数目 ( 采 
用 1ofn 编 码 = 类 别 数 ) 
int nInputs = т data.GetInputNum(); // 输 入 单元 数目 


m nTimer = SetTimer(1, m nTimeStep, NULL); // W Ë XE 
Пат, НЕП ЛЕШ рка] RA 
Џраа+ера+а (гие); // 更 新 配置 参数 


// 创 建 网 络 
if( m pNet != NULL ) 
delete m_pNet; 
т pNet = new CNeuralNet(nInputs, nOuputs, m_nNeuron 


5); 


// 根 据 用 户 输入 配置 网 络 参 数 

m pNet->SetMaxEpoch(m nMaxEpoch); 

m pNet->SetMinError(m dError); 

m pNet->SetLearningRate(m dLearningRate); 


CString 5%гОиї; // НААН 


// 载 入 训练 配置 文件 
CString strTrainFilePath; 
m EditTrainFile.GetWindowText(strTrainFilePath); 
if(strTrainFilePath.GetLength() == ө) 
{ПУА TB E ИИО CF, ЗУУРА 
AfxMessageBox(" 请 指定 一 个 用 于 你 存 训 练 结 果 的 训练 配置 文 
件 以便 开 始 训 练 !1"); 
m_bInTraining = false; 
( (CButton* )GetD1gItem(ID BUTTON TRAIN) )->Enable 
Window(true); 
( (CButton* )GetD1gItem(ID BUTTON STOP) )->EnableW 
indow(false); 
EnableControls(true); 
return; 
J 
if(!LoadFromFile(strTrainFilePath)) 
( / / r BJ UI ZE 
AfxMessageBox ( "9% FI VL AEA VI Ис. ЖЇР НЕ у 5 EB. 
数目 及 生 变化 ! 重 新 训练 网 络 .") ; 
m pTrack->Init(); 


} 
else// 继 续 上 次 训练 
m_pTrack->Draw(); 


// 更 新 配置 参数 
UpdateData(Ctrue ) ; 


// 在 对 话 框 标题 栏 显示 网 络 结构 信息 
int nNeurons = m pNet->GetNumNeuronsPerLyr(); // Ж 
Ел H 
strOut.Format("inputs: %d outputs: %d nerons: %d", 
nInputs, nOuputs, nNeurons); 
SetWindowText(strOut); 


// 统 计 训 练 时 间 开 始 

DWORD dwEsplise = ::GetTickCount(); 

m bInTraining = true; // 开 始 训 练 

m pNet->Train(m data.GetInputSet(), т data.GetOutpu 
tSet());// 训 练 


// 保 存 训练 成 果 文 件 

CString strFilepathName; 

m EditTrainFile.GetWindowText(strFilePathName); 
SaveToFile(strFilePathName); 


KillTimer(m_ nTimer);// ЇЙ ТҮГЕ gs 
UpdateTrainInfo();// 5з т 1212191, 


// 统 计 训 练 时 间 结 束 
dwEsplise = ::GetTickCount() - dwEsplise; 


strOut.Format(" 训练 结束 ， 用 时 : %d Р", dwEsplise/100 
9); 
AfxMessageBox(strOut); 


// 更 新 UI 状 态 

( (CButton* )GetD1gItem(ID BUTTON TRAIN) )->EnableW 
indow(true); 

( (CButton* )GetD1gItem(ID BUTTON STOP) )->EnableWi 
ndow(false); 

EnableControls(true); 


m bInTraining = false; // 训 练 结 


”| 
(2) 实时 更 新 训练 信息 
CTrainDIg::UpdateTrainInfo 


Z RARI RAER RA, ЈНУ 
= AI AI ARAIRE EE n ERS EJE Ар. 





void CTrainDlg::UpdateTrainInfo() 
{ 


// ВАЗ В ЛЕ ЭРЭ ПИ т 2 HI Zk 
double dErr = m pNet->GetError(); 
m pTrack->AddValue(dErr); 

m pTrack->Draw(); 


// ЗНИК [д д, WR ER NERE SI 

int nEpoch = m pNet->GetEpoch(); 

CString strOut; 

strOut.Format(" 时 代 :%d， 误 差 :%f"，nEpoch，dErr); 
m_StaticShow.SetWindowText(strOut); 





此 外 ， 还 需要 在 CTrainDlg:: OnTimer K 2% rH ii 
用 UpdateTrainInfo0 函 数 以 过 到 定时 更 新 的 目的 。 
OnTimer0 中 的 调用 请 断 如 下 。 





15.4.8 ”测试 对 话 住 类 一 一 CTestDlg 


测试 对 话 性 类 CTestDlg 负 贡 与 测试 /识别 有 天 有 的 
设置 ， 利 用 它 可 以 识别 条 一 图 像 中 的 数字 或 测试 网 
SENIN Н КАИН, FOX TL S Ja kË 

К ЖЛЕ) PLE E ә MIRTA 
на 识别 对 话 框 如 图 15.17 所 示 。 








选择 训练 | 
配置 文件 ` 


测试 图 像 
显示 区 域 
















选择 测试 文件 | | Б 
HAERWAR U wenera eanan ИТ: | WAAR 


所 在 的 目录 





E Mrans me .| 厂 目录。 HER: -一 | Ж 
如 要 测试 整个 目 。_ | | 
录 中 的 图 像 , 选 | 识别 和 测试 | 停止 G@) | 
择 此 选项 | 


415.17 ”识别 和 测试 对 话 框 
CTestDlg 类 的 部 分 数据 成 员 如 下 所 示 。 





CNeuralNet *m pNet; // 神 经 网 络 对 象 

CNeuralData m_data; // 神 经 网 络 的 数据 格式 

double m dHighestOutput; // 最 大 输出 单元 的 啊 应 
int m nBestMatch; // 识 别 出 的 类 别 

CRect m_rt; // 图 像 处 理 的 矩形 区 域 

BOOL m_bInTest; // 是 售 在 测试 (识别 ) 中 
COCRImageProcess т Img; // 待 识别 图 像 
vector<CString> m теа // 类 别名 称 信息 
BOOL m_bReadyToRec; // 是 否 可 以 进行 识别 


CTestDlg 茯 的 OnButtonRecO 成 员 函 数 说 明 如 
|. 


早 击 测试 对 话 框 上 的 “识别 和 测试 ”按钮 ， 触 友 
OnButtonTestO 函 数 。 谤 图 数 利 用 之 前 训练 过 的 网 
络 〈 由 训练 配置 文件 指定 ) 进行 识别 ， 如 果 是 识别 
жй, ЖЖ ЛЖ ЛАШ ЯГ ИЙЕ л» {д БЛП 
本 次 识别 的 置信 和 上 度 ; 如 果 选 中 了 测试 对 话 框 中 
的 “日 录 ” 复 选 杠 ，OnButtonRec0 函 数 会 对 选 定 的 测 
试 目录 中 的 所 有 bmp 文 件 进 行 识 别 ， 并 将 结果 你 存 
至 配置 文件 中 。 


下 面 给 出 OnButtonRecO 的 完整 实现 。 


void CTestDialog::OnButtonRec() 


CString strTrainFile; 
m EditFile.GetWindowText(strTrainFile);// 取 得 测试 文 


件 路 径 信息 
if(strTrainFile.GetLength() == ө) 
l 
AfxMessageBox(" 还 没有 选择 识别 文件 或 测试 目录 !1"); 
return; 


J 
if(!m_bReadyToRec)// 没 有 指定 训练 配置 文件 
{ 


AfxMessageBox(" 请 站 和 完 指定 一 个 训练 配置 文件 以 便 开始 识别 
1"); 


return; 


} 


m_bInTest = true; // 测 试 中 标志 
( (CButton* )GetD1gItem(IDC BUTTON STOP) )->EnableW 
indow(true); // 局 用 停止 按钮 


BOOL bDir = m CheckDir.GetCheck(); //х (Tú E Н з 
选项 


if(!bDir) // 测 试 一 个 文件 
l 
CString strFile; 
m_EditFile.GetWindowText(strFile); 
double dConfidence; // 置 信 度 
int nClass = m pNet->Recognize(strFile, m rt, dCon 
fidence); // 识 别 
CString str; 
CString strRec; 
if(nClass >= 0) 
l 
strRec = m_vecClassNames[nClass]; 
str.Format(" 识别 结果 : %s 置信 度 : %%%d ", strRec 
， (int)(dConfidence*100)); 


else 
str = "识别 失败 
MessageBox(str); 


J 

else // 测 试 整 个 目录 

l 
WIN32 FIND РАТА findData; 
HANDLE hFindFile; 
CString str; 


//1ТЛ ЖИЛЕ, ЗЕН РЕЗА] 9 ЯВ) CE 
CFileDialog saveDlg(FALSE, "txt", "", NULL, "txt Е 


iles(*.txt)|*.txt||", NULL); 
if(saveDlg.DoModal() != IDOK) 


l 
( (CButton* )GetD1gItem(IDC BUTTON STOP) )->Enab 
leWindow(false); 
// 茶 用 集 止 按钮 
m bInTest = false; 
return; 
J 
CString strRecFile = saveDlg.GetPathName(); // Vly 
结 末 文件 


CFile file; 
if(!file.Open(strRecFile, CFile::modeCreate|CFile: 
:modeWrite)) 
{ 
МеѕѕареВох(" create result file Ғаі1еа!"); 
( (CButton* )GetD1gItem(IDC BUTTON STOP) )->Enab 
leWindow(false); 
// 茶 用 集 止 按钮 
m bInTest = false; 
return; 


) 


CString strDir; 
m EditFile.GetWindowText(strDir);; // {11 Н KE 


径 信息 
if(strDir[strDir.GetLength() - 1] != 'NN') 
{ 
strDir += '\\'; 
J 


CString szFileName = strDir; 
szFileName += "*.bmp"; // 搜 索 目 标 为 目录 下 的 所 有 bmp 文 
件 


str = " \r\n ЗЈН у: \г\п \г\п"; 
file.Write(str，str.GetLength());// 写 识别 结果 文件 


int nTotal = Ө; // 测 试 样 本 总 数 
int nNotRec = Ө; // 识 别 失 败 的 次 数 
double dConfidence; // 置 信 度 
CGray ImageTmp 


hFindFile = ::FindFirstFile(szFileName, &findData) 


if(hFindFile != INVALID HANDLE VALUE) 


{ 
do 


{ 
// 名 称 为 “.” 的 目录 代表 本 目录 ， 名 称 为 “..” 的 目录 代表 
上 一 层 目 录 
if(findData.cFileName[0] == '.') 
continue; 


if(!(findData.dwFileAttributes & FILE ATTRIBUT 
E DIRECTORY)) 
{// 找到 的 不 是 目 孙 而 是 文件 
str = strDir; 
str += findData.cFileName; 


int nClass = m pNet->Recognize(str, m гі, dC 
onfidence); 


CString strRec =“" 识 别 失 败 1"， 
if(nClass >= 0) 

strRec = m месС1аѕѕМатеѕ [пс1аѕѕ |; 
е1ѕе 

nNotRec ++; 


CString strToWrite; 
strToWrite.Format(" 文件: %s ”类别 标 写 : %s В 


Ja: %%%d \г\п", 
findData.cFileName, strRec, (int)(dConfide 
nce*100)); 
file.Write(strToWrite, strToWrite.GetLength( 
)); // 写 入 识别 结果 文件 


nTotal ++; // 样 本 总 数 +1 
} 


ywhile(::FindNextFile(hFindFile, &findData)); 
::FindClose(hFindFile); 
} 


str.Format("\r\n 识别 结束 ， 总 数 : %d， 失 败 : а \r\n" 
, hTotal, nNotRec); 

file.Write(str, str.GetLength()); 

file.Close(); 


MessageBox(str);// 显 示 测 试 信息 
ShellExecute(m hWnd, "open", "notepad.exe", strRec 
File, NULL, SW SHOW ) ; 
// 打 开 识 别 结 末 文件 
J 


m bInTest = false; // 测 试 结束 


I 


15.5 ”基于 ANN 的 数字 字符 识别 系 
统一 DigitRec 的 测试 


本 节 对 DigitRec 系 统 进行 最 基本 的 测试 。 通 过 
学 习 ， 读 者 可 掌握 DigitRec 系 统 的 使 用 方法 。 


运行 DigitRec 后 ， 程 友 主 寞 夯 如 图 15.18 所 示 ， 
系统 主要 功能 都 集 成 在 “神经 网 络 数 字 识 别 ” 及 上 


О 


== DigitRec 

iHD 查看 (У) ОШО ЫЕ 
= < щёа@ | 

| 识别 和 测试 (Е) 





图 15.18 ”DigitRec 系 统 主 界面 
15.5.1 训练 


单 击 “ 和 神经 网 络 数字 识 列 ? 腔 单 下 的 “训练 ? 命 


令 ， 将 打开 训练 对 话 框 。 设 定 最 大 训练 时 代数 为 

8000, zÆ /80.001, 227 270.1, WEJ 
数目 为 4 选择 训练 样本 分 类 目录 所 在 的 位 置 ОЧ 
于 本 节 的 数据 集 就 是 “Train” 文 件 夹 所 在 的 位 置 〉; 
新 建 一 个 配置 文件 “drl.net”， 如 图 15.19 上 所 示 。 


最 大 时 代数 [5000 一 ШЕ ЕЖЕН Ж 
ха з= БЕ] ШИШ E: Train 
тыж ру 
сыл р ка; 
时 间 轴 步 长 (100 =b E: \dri. net {е 


Ча ВЕТВЬ, 





415.19 ”训练 相关 参数 的 设置 


单 击 “ 训 练 ” 按 钮 ， 由 于 “drl.net” 是 新 的 配置 文 
件 ， 系 统 提 示 需 要 重新 训练 网 络 ， 单 击 “ 确 定 ” 后 训 
练 开 始 。 当 梯度 下 降 算 法 迭代 到 之 前 设 定 的 最 大 时 
代数 8000 时 ， 训 练 结 束 ， 显 示 此 时 的 误差 为 
0.003341， 训 练 过 程 尽 共 耗 时 35s， 如 图 15.20 所 


Дуо 


最 大 时 代数 iD ТЕЗТЕЗ 
BRE [о ë 
sgg mr pass 
сысы И 训 绕 配置 立 件 


时 间 轴 步 长 1 DigitRec 


训 诸 误差 随时 间 的 变 尼 Mtt: 8001, ie% 0. 003341 





415.20 УЖ 2& 
15.5.2 ”测试 


Ват; “12е о 2® 5 TH a E К ВАИЛ FI] 
试 ” 命 令 ， 打 开 识 别 和 测试 对 话 框 。 选 择 在 15.5.1 小 
节 得 到 的 训练 配置 文件 “drl.net”*”， 人 勺 选 “月 录 ” 复 选 
柱 ， 接 大 选择 测试 集 目录 (这 里 为 “E:\Testset”) , 
早 击 “识别 和 测试 ”按钮 ， 在 弹出 的 为 存 为 对 话 框 中 
选择 要 你 和 存 识 别 结 果 的 文本 文件 (这 里 
为 “result.txt”) ， 如 图 15.21 所 示 。 











选择 训练 
识别 和 测试 配置 文件 тн 


训 绮 配置 文件 
[E:\arl.net 











选择 测试 集 
所 在 的 目录 





А те atabase (СЭ) MWBLGBP 
不 所 在 跤 征 或 测试 集 所 在 目 弱 二 iit Ga рараг 538 


е 1sks 辐 FFLiveyhAshareFlv [Train 

y “ 3”, is _ 
5% H K С а — se igi DTrainsamplel | 
复 选 框 БЕДЕ ДЕ < | =! 








WHE N): [result 保存 (5) 
2598 (Т): [txt Files (ж. txt) Y | 职 消 | 


15.21 测试 独立 测试 集 上 的 识别 率 


单 击 “ 保 存 ” 按 钮 ， 开 始 识 别 ， 结 束 后 弹出 识别 
信息 对 话 框 ， 显 示 总 共 对 10 个 测试 样本 进行 了 识 
列 ， 全 部 识别 成 功 〈 没 有 识别 不 出 结果 的 情况 ) ， 
如 图 15.22 所 示 。 

早 击 “人 确定 ”按钮 ， 将 打开 识别 结果 文件 (这 里 


为 “result.txt*”) ， 其 中 列 出 了 对 每 一 个 样本 文件 的 
识别 结果 和 置信 度 信 息 ， 如 图 15.23 所 示 。 





图 15.22 ”识别 情况 信息 


P result.-tzt 一 TE 
ЭС (Е) SH (Е) AAD е (у) AE A 





ЗАПА: 

Г B Uerdana.bmp | 本 号 : в ЕЕЕ: 党 88 
T 1 Uerdana.bmp 2 ТЕ 1 = а: %92 
Г 2 Uerdana -bmp | S 2 JAE: %94 
TE 3 Verdana.bmp H| Т5 : з BAE: 579 
Г 4 Uerdana. bmp H| FA: н AAE: %81 
TE 5 Verdana.bmp H| FA: 5 ЕЕГ: %45 
МГ 6 Uerdana.bmp H| Fa 6 BAE: %79 
TE 7 Uerdana.bmp H| Fa 7 BAE: %56 
МГ 8 Uerdana.bmp H| 57: 8 ЕЕ E: 党 49 
МАЖЕ: 9 Uerdana.bmp аре: 9 百 情 度 : 579 





下 


E] 


ЫЗ Н, SA: 18, Ж: ü 


— 


图 15.23 ”识别 结果 文件 


可 以 看 到 ， 网 络 对 独立 测试 集中 的 10 个 样本 全 
部 识别 正确 ， 这 主要 是 因为 训练 集 与 训 弃 集 郡 相当 
理 四 《无 噪声 且 大 小 经 过 归 一 化 的 二 信 图 像 ) ， 且 
名 弃 上 集 图 像 中 的 数字 只 古 与 训练 集中 的 字体 不 同 。 


15.6 ”改进 的 DigitRec 


到 目前 为 止 ，DigitRec 系 统 还 只 能 在 最 为 理想 
的 情况 下 工作 ， 训 练 图 所 与 测试 图 卢 均 为 不 侣 有 了 噪 
声 且 大 小 经 过 归 一 化 的 二 全 网 像 ， 这 不 得 不 说 是 一 
个 遗憾 。 读 者 希望 DigitRec 可 以 像 一 个 真正 的 OCR 
ЖАЛЕ, Ве уЗ ЛАЧ, ЖАЗ 
AX ERAB FAWL ЕП ЖГ = 44 КЖ де Р 5 TK 


数字 字符 图 像 。 通 过 将 必要 的 图 像 处 理 技术 引入 到 
DigitRec 系 统 中 来 ， 上 述 需 求 都 是 可 以 实现 的 。 


15.6.1 数字 字符 图 像 的 预 处 理 关 
—COCRImageProcess 


ТЕЛЕ HJ] BAAN CImgProcess H ih КУКЕ 
出 数字 字符 识别 的 图 像 人 处理 类 COCRImageProcess， 
它 在 一 些 退 用 处理 算法 的 基础 上 进一步 封 汉 了 专门 
针对 数字 字 从 图 像 预 处 理 的 方法 。 
在 今后 的 工程 实践 中 ， 读 者 可 仿照 COCRImageProcess 类 从 
CImgProcess 派 生出 针对 特定 问题 的 图 保 处 理 类 。 


COCRImageProcess 类 的 完整 定义 如 下 。 





// 从 通用 图 像 处 理 类 CImgProcess 派生 ， 专 门 负 责 数字 识别 系统 图 
像 预 处 理 的 类 
class COCRImageProcess : public CImgProcess 
l 
public: 
COCRImageProcess(); 
virtual ~COCRImageProcess( ) ; 


/ DUTE 

void SlopeAdjust(COCRImageProcess* pTo); // 目 标 对 象 
CFE BAKRE ТИ ЛЕ 

vector<RECT> ObjectSegment(); // 对 象 (字符 ) 分 割 


void ObjectNorm(COCRImageProcess* pTo, int nTargWid 
th, int nTargHeight, vector 
<RECT> &vecRT); // 对 象 “〈 字 符 ) 大 小 归 一 化 
void ObjectAlign(COCRImageProcess* pTo, vector<RECT 
> &vecRT); 
// 目 标 对 象 〈 字 符 ) 的 紧缩 对 齐 
// 点 运算 
RECT RgnZoom(COCRImageProcess* pTo, int nTargWidth, 
int nTargHeight, LPRECT LpRect);// 图 像 中 某 个 区 域 的 缩放 
J; 





为 在 工程 中 使 用 COCRImageProcess， 需 在 
stdafx.h 中 包含 该 关 的 头 文 件 OCRImageProcess.h。 


#include “./OCRImageProcess/OCRImageProcess.h" 





15.6.2 ”输入 图 像 的 预 处 理 实现 


如 图 15.24 所 示 为 一 由 来 目 扫 插 仪 的 印刷 体 数 字 
子 从 图 像 。 


192930123456701678769437654 765017623889 


415.24 1 1 ѕсапрірі.Ьтр 


1， 预 处 理 步 又 


图 15.24 是 一 幅 带 有 噪声 的 RGB 图 像 ， 其 中 的 
数字 具有 不 同 的 字体 ， 大 小 和 间距 不 一 旦 排列 具有 
一 定 的 倾斜 度 。 为 得 到 归 一 化 的 训练 集合 ， 需 要 对 
图 像 进行 如 下 的 预 处 理 。 


(1) RGB 位 图 (24 位 ) 的 灰 度 化 

首先 需要 将 直接 由 扫 摘 仪 得 到 的 RGB 图 像 转 化 
为 大 多 数 图 像 处 理 算法 能 够 处 理 的 灰 度 图 像 ， 但 这 
里 并 不 需要 显示 地 转换 ， 因 为 CImg 类 有 的 GetGray0 
图 数 中 隐 含 了 将 RGB 图 像 灰 度 化 的 逻辑 。 

(2) KE BZ МН. 

为 将 图 像 中 的 目标 字符 同 背 景区 域 分 离 ， 应 进 
行 灰 度 图 像 的 二 值 化 处 理 ， 二 值 化 的 净值 可 由 用 户 
在 “图 像 预 处 理 ” 对 话 框 中 指定 ， 默 认为 145。 


二 值 化 处 理 的 相应 代 公 如 下 。 





以 145 为 浆 值 进行 二 值 化 处 理 后 的 效果 如 图 
15.25 所 示 。 


192930123456701678769437654 765017623889 


415.25 ”二 值 化 图 像 
(3) 去 除 噪声 


在 图 15.25 中 ， 一 些 噪声 也 被 二 从 化 为 图 像 的 前 
景 部 分 〈 黑 色 ) ， 这 会 给 后 续 预 处 理 步 又 造成 很 多 
困难 ， 为 此 需要 利用 基于 连通 区 域 的 方法 去 除 离散 
或 成 斤 品 声 。 由 于 读者 有 天 于 字符 大 小 的 先 验 知 
识 ， 因 此 可 认为 大 小 为 <lowerThres 或 者 >upperThres 
AIEEE D Jy HJ RE HIIRE DK IR, 应 将 它们 从 图 像 中 清 
К. 

COCRImageProcess2SR:JDelScatterNoise() РЁ 2 
KIERPER ВЕ, €a AAEM 
ClImgProcess2SijJPixellmage( ŘAS m, ЖЕР 
EEEH Y TestConnRgn( KRR MEAK 


下 面 给 出 DelScatterNoise 0 函数 的 完整 实现 。 





ОРАУ ВИР 

void COCRImageProcess::DelScatterNoise(COCRImageProcess 
* pTo, int lowerThres, int upperThres ) 

功能 : 去 除 图 像 中 的 离散 噪声 : 滤 除 大 小 低 于 lowerThres 的 连 
通 区 域 ; 滤 除 大 小 超过 upperThres 的 连通 区 域 ;其 他 保留 

注 : 只 能 处 理 2 值 图 像 


参数 : COCRImageProcess* pTo: 目标 图 像 的 COCRImageProc 
ess 指针 

lowerThres: ҺО 8 

upperThres: 上 限 国 值 
BEE: Ж 
ЖОКЕ КЕЕ КЕЕ ЕЕЕ КОКЕ / 
void COCRImageProcess::DelScatterNoise(COCRImageProcess 
* pTo, int lowerThres, int upperThres) 


l 
if(upperThres < lowerThres) 
AfxMessageBox(" 上 限 国 全 必须 大 于 下 限 国 但 ! "); 
return; 
J 
if(lowerThres < Ө) 
lowerThres = 0; 
if(upperThres > 1500) 
upperThres = 1500; // 为 防止 深度 递归 栈 益 处 ， 限 定 upper 
Thres 的 最 大 值 为 1666 


COCRImageProcess image bkp = *this; 
COCRImageProcess image res *pTo; 


int nHeight = pTo->GetHeight(); 
int nWidth = pTo->GetWidthPixel(); 


int i,J; 

unsigned char pixel; 

LPBYTE lpVisited = пем BYTE[nHeight*nWidth]; // 标 记 
AM жетт СЛ li| i 


for(i=0;i<nHeight*nWidth;i++) 
lpVisited[i] = false; // 初 始 访问 标记 数组 


int curConnRgnSize = Ө; // 当 前 发 现 的 连通 区 的 大 小 


int nPtArySize = upperThres + 10; // 记 有 录 访 问 点 坐标 数 
组 的 大 小 ， 是 一 个 不 能 小 于 We 的 量 

CPoint* ptVisited;// 记 录 对 于 连通 区 的 一 次 探 碍 中 访问 过 的 
点 的 坐标 


ptVisited = new CPoint[nPtArySize]; 
int k = 0; 


for(i=0;i<nHeight; i++) 
l 
for(j=0;j<nWidth;j++) 
l 


for(k=0;k<curConnRgnSize;k++) 
1pVisited[| ptVisited[|k].y*nWidth + ptVisited[|[k] 
Г = false; 
// 还 原 lpVisited 数组 


curConnRgnSize = 0; // 重 置 为 8 
pixel = image bkp.GetGray(j, i); 


if( pixel == © ) // 找 到 1 个 黑 像 素 ， 进 而 探查 该 像素 所 
处 的 连通 区 域 的 大 小 
{ 
int nRet = ТеѕЕСоппКеп (&ітаре bkp, lpVisited, 
nWidth, nHeight, J, 1, 
ptVisited, lowerThres, upperThres, curConnRgnSize); 


if( (nRet == 1) || (nRet == -1) ) // >иррегТһг 
es or <lowerThres 


/ ERR 


for(k=0; k<curConnRgnSize; k++) 
l 


image res.SetPixel(ptVisited[k].x, ptVisit 
ed[k].y, RGB(255, 


255, 255)); 
} 
} 
} 


y// for j 
}// for i 


*pTo = image res; 


delete |]lpVisited; 
delete [ JptVisited; 


调用 DelScatterNoiseO) 函 数 去 除 噪 声 的 相应 代 但 
如 下 。 


m_OCRImg.DelScatterNoise(&m_OutOCRImg, nLower, nUpper); 
/ [KRA З 


// 其 中 nLower 和 nUpper 分 别 为 噪声 尺寸 的 上 上、 下限 ， 可 由 用 户 在 “图 


像 预 处 理 ” 对 话 框 中 指定 。 小 于 nLower 
// 和 大 于 nUpper 的 连通 区 域 被 认为 是 噪声 





Б БЕ ра ДЫШ Ja ЇЇ) ЖЯ АП 15.26/7х 


192930123456701678769437654 765017623889 


415.26 ”去 除 噪声 后 的 图 像 


СД) ЗЕТЕ ЛЕ 
—COCRImageProcess::SlopeAdjust 


扫描 图 像 中 的 数字 可 能 存在 一 定 程度 的 倾斜 
需要 进行 适当 的 调整 以 使 得 字符 都 处 于 同一 水 平 位 
置 ， 这 样 既 有 利于 后 续 的 字符 分 割 也 可 以 降低 字符 
识别 时 的 难度 。 


一 般 来 说， 对 于 夯 干 子 侍 组 成 的 图 像 ， 如 未 左 
右 两 边 字 符 像 素 的 平均 位 置 有 比较 大 的 起 洲 ， 残 说 
明 图 像 存在 倾 笠 。 因 此 可 以 根据 图 像 左 、 右 两 边 的 
黑色 像 系 的 平均 品 度 进行 调整 。 


MIAA WEIHE ЗАЗ УИ, 2721 
ЖШ АЕ ИРЛИ ЛЕ Саак W 21 И 
ЖНА); ТЕШ ЛЫШ ЕТЕ, ЖЫЙ 
җе Т2 2А Ей, SER E МОГИ EH Eš 
像 的 像 系 映 射 过 程 ， 属 于 图 像 几 何 变 换 的 范 明 ， 其 
шш 闪 似 于 第 4 章 学 习 过 的 六 部 分 几何 变换 算 


下 面 给 出 SlopeAdjustO 算 法 的 完整 实现 。 


S re For Ti В 


void COCRImageProcess::SlopeAdjust(COCRImageProcess* pT 
о) 

功能 。 ”调整 图 像 中 前 景物 体 的 倾斜 度 ， 使 其 尽量 处 于 一 个 水 平 位 
置 上 。 比 较 适 合 于 横 回 分 布 的 物体 ， 如 字符 的 调整 


人 参数: COCRImageProcess* pTo: 目标 图 像 的 COCRImageProc 
ess 指针 
BEE: Æ 


TEETTT TDM TD 


void COCRImageProcess::SlopeAdjust(COCRImageProcess* pT 


о) 
{ 

int i,J; 

double dAvgLHeight = 0; // 图 像 左 半 部 分 前 景物 体 的 平均 局 
度 

double dAvgRHeight = 0; // 图 像 右 半 部 分 前 景物 体 的 平均 局 
度 


// 取 得 图 像 的 高 和 宽 

int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 
int nGray; 


int nWeightSum = 0; //®Х РАЕН НУ ЕЕЕ ЯП 
/ 1221739120781, ТЕА HJ" JJ JH т ЛУ 


for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth/2; j++) 


nGray = GetGray(j, i); 
if(nGray == 6)// 是 前 景物 体 〈 黑 ) 


l 
ят ЛЕНО, аак Р Н 77 ЙС SE Z НАХ rE: 
nWeightSum += nWidth/2 - j; 


dAvgLHeight += i*(nWidth/2 - j); 
} 
}//for j 
}//for i 


dAvgLHeight /= nWeightSum; // 平 均 加 权 高 度 
nWeightSum = Өө; 


// 逐 行 扫描 右 半 部 分 图 像 ， 计 算 黑 色 像 素 的 平均 加 权 高 度 
for(i=0; i<nHeight; i++) 
l 
for(j=nWidth/2; j<nWidth; j++) 
l 
nGray = GetGray(j, і); 
if(nGray == @)// х= 577 С) 


l 
ПГ J JJH I, ZS 3 W 42 BJ z< 27 u Hi Z BJ M si: 
nWeightSum += j - nWidth/2; 
dAvgRHeight += i*(j - nWidth/2); 
J 
}//for j 
}//for i 


dAvgRHeight /= nWeightSum; 
double dSlope = (dAvgLHeight - dAvgRHeight) / (nWid 
th/2); // 计 算 和 斜率 


int nYSrc; //y 的 源 坐 标 


// 扫 揪 狐 图 像 ， 根 据 冬训 得 到 的 新 旧 图 像 的 映射 天 系 为 每 一 个 像 
ЖАК ME 
for(i=0; i<nHeight; i++) 


l 
for(j=0; j<nWidth; j++) 


l 
// 找 到 与 新 图 像 的 当前 点 对 应 的 旧 图 像 点 的 水 平 坐标 (以 水 


平方 癌 中 点 为 中 心 ) 
nYSrc = int(i - (j - nWidth/2) * dSlope); 
if( nYSrc < Ө || nYSrc >= nHeight ) // 对 应 点 在 不 


ТЕ. s| ХБ С | 
пбгау = 255; 
е1<е 
nGray = GetGray(j, nYSrc); 
pTo->SetPixel(j, i, RGB(nGray, nGray, nGray)); 


/ / Waki РАЛУ SA ИН ут ИЗИ ЛАА 
}//for j 
}//for i 


) 


调用 SlopeAdjust 0 函数 实现 倾斜 度 调整 的 相应 
代码 如 下 : 


m OCRImg.SlopeAdjust(&m OutOCRImg); // 倾 斜 度 调整 
经 过 倾斜 度 调 整 的 图 像 如 图 15.27 所 示 。 
19293012345670167876》437654765017623889 


415.27 ЛЕЕ ЧИИ 


(5) 字符 分 制 
—COCRImageProcess::ObjectSegment 


ANN 在 训练 和 识别 时 都 只 能 将 1 个 单独 的 数字 
作为 样本 ， 因 此 对 于 扫描 图 像 中 的 多 个 连续 数字 需 


要 进行 分 割 。 
字符 分 割 可 以 控 照 如 下 步 缀 进行 。 


O ЖЕК НЕЛЕ Kama 5 : 先 目下 加 
上 对 图 像 进行 逐 行 扫 摘 直 到 过 到 第 一 个 黑色 像素 ， 
记录 下 行 写 ; 然后 再 自 上 同 下 对 图 像 进行 逐 行 扫 撞 
二 到 找到 第 一 个 黑色 像 系 ， 记 录 下 行 号 。 这 两 个 行 
号 驶 标识 出 了 字符 大 致 的 高 度 范围 。 


D MEREDTEK ERMA AEM: 在 第 
OFFRA ERWE А AHATEA, 218 
到 第 一 个 黑色 像 系 时 认为 是 字符 分 割 的 起 始 位 ， 然 
后 继续 扫 朱 ， 直 到 遇 到 有 一 列 中 没有 黑色 像 系 ， 认 
为 是 这 个 字符 的 右 终 止 位 置 ， 准 备 开 始 下 一 个 字符 
的 分 割 。 按 照 上 述 方法 继续 扫描 ， 直 到 扫描 全 图像 
的 最 石 病 。 这 样 束 得 到 了 每 个 字符 的 比较 精确 的 先 
БЕ yt E] 

@ 在 已 知 的 每 个 字符 比较 狂 确 的 宽度 范围 内 ， 
再 按照 第 山 步 的 方法 ， 分 别 目 上 而 下 和 目下 而 上 的 
逐 行 扫 擂 来 获取 每 个 字符 狂 硝 的 高 度 范 围 。 


字符 分 割 算 法 ObjectSegment() 的 完整 实现 如 


下 ， 函 数 返 回 一 个 RECT 向 量 ， 其 中 包含 了 各 个 分 
割 后 字符 的 轮廓 矩形 。 


ИИО КЕКЕ 


vector<RECT> COCRImageProcess: :ObjectSeement( ) 


功能 : 对 前 景 目 标 〈 如 字符 ) 进行 划分 ， 将 各 个 字符 轮廓 矩形 返 
[н] 

Е: 只 能 处 理 2 值 图 象 

参数 : 无 


返回 值 : vecRECT: 包含 各 个 字符 轮廓 矩形 的 RECT 回 量 


ОРЕ ТОИ 


vector<RECT> COCRImageProcess::ObjectSegment() 
{ 


zH 


vector<RECT> vecRoughRECT; // 粗 略 对 象 轮廓 的 和 矩形 向 量 数 
vector<RECT> vecRECT; // 精 化 后 对 象 轮廓 的 窍 形 同 量 数组 


// 清 衬 用 来 表示 每 个 对 象 区 域 的 vector 
vecRoughRECT.clear(); 
vecRECT.clear(); 


int И 
int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 


int nTop, nBottom; // 整体 前 景区 域 的 上 下 边界 
int nGray; //BAXKE 
int nObjCnt = 0; // 对 象 数 目 


// 从 上 癌 下 逐 行 扫 摘 ， 找 到 整体 前 景区 域 的 上 边界 
for(i=6; i<nHeight; i++) 
l 

for(j=0; j<nWidth; j++) 

l 


nGray = GetGray(j, i); 
if(nGray == 0) 
l 


nTop = i; 
і = nHeight; // 对 i 赋 大 值 ， 使 得 在 break 跳 出 内 层 循 
环 后 ， 直 接 可 以 再 跳出 外 层 循环 
break ; 
J 
y// for j 
}// for i 


// 从 下 同上 逐 行 扫 摘 ， 找 到 整体 前 景区 域 的 下 边界 
for(i=nHeight-1; i>=0; i--) 
l 

for(j=0; j<nWidth; j++) 


nGray = GetGray(j, i); 
if(nGray == 0) 
{ 


nBottom = 1; 

і = -1; //ХАЛМА, Ef Ebreakik h РУ, 
直接 可 以 再 跳出 外 层 循环 

ргеак; 


J 
y// for j 
}// for i 


bool bStartSeg = false; // 是 人 否 已 开始 荣 一 个 对 象 的 分 割 
bool bBlackInCol; // 7] + RERA 


КЕСТ rt; 
FAIA, Ф НЕ. 2027 


for(j=0; j<nWidth; j++) 
l 


bBlackInCol = false; 
for(i=0; i<nHeight; i++) 
{ 
nGray = GetGray(j, i); 
if( nGray == Ө ) 
{ 
bBlackInCol = true; // 访 列 中 发 现 黑 点 
if(!bStartSeg) // 还 没有 进入 一 个 对 象 的 分 割 


rt.left = j; 
bStartSeg = true; // 目 标 分 割 开始 


} 
else // 仍 处 于 茶 一 个 对 象 之 内 


break ; 
]// if( gray == 6 ) 
y// for i 
if( j == (nWidth-1) ) у, НА 
像 扫 摘 完 毕 
break ; 


if(bStartSeg && !bBlackInCol) 
// 正 处 在 分 割 状态 且 扫 朱 完 一 列 都 没有 及 现 黑 像素 ， 表 明 当 前 对 象 分 
制 结束 
l y 
rt.right = j; //%ZUH02 ЯЕ 


[RRR Е РО ОНИ TK) 


rt.top = пТор; 
rt.bottom = nBottom; 


::InflateRect(&rt, 1, 1); // 和 矩形 框 膨胀 1 个 像素 ， 以 
免 绘制 时 压 到 字符 


vecRoughRECT.push back(rt); //#ü A vector 


bStartSeg = false; // 当 前 分 割 结束 
nobjCnt ++; // 对 象 数目 加 1 
J 


/ ЖА К 1339 
y// for j 


RECT rtNew; // 08107 # C Eki a ЛЕЛЕ 


//H-T Ze 21] Y ie. 12027, MAE АГ РНИИ КЛЕЈ Е 
FUF 

int nSize = vecRoughRECT.size(); 

for(int nObj=0; nObj<nSize; nObj++) 

l 


rt = vecRoughRECT|[nObj]; 


rtNew.left = rt.left - 1; 
rtNew.right = rt.right + 1; 


// 从 上 问 下 逐 行 扫 插 确定 上 边界 
for(i=rt.top; i<rt.bottom; i++) 
l 
for(j=rt.left; j<rt.right; j++) 
l 
nGray = GetGray(j, і); 
if(nGray == 0) 


rtNew.top = 1-1; 
i = rt.bottom; 
// 对 i 赋 大 值 ， 使 得 在 break 跳 出 内 层 循环 后 ， 直 接 可 以 再 跳出 外 层 特 
环 
ргеак; 
J 
y// for j 


}//for i 


// 从 下 同上 逐 行 扫 朱 确定 下 边界 
for(i=rt.bottom-1; i>=rt.top; i--) 
l 
for(j=rt.left; j<rt.right; j++) 
l 
nGray = GetGray(j, i); 
if(nGray == 0) 


rtNew.bottom = i+l; 

1 = rt.top-1; 
// 对 i 赋 小 值 ， 使 得 在 break 跳 出 内 层 循环 后 ， 直 接 可 以 再 跳出 外 层 循 
坏 


break; 


J 
y// for j 
y//for i 


vecRECT.push back(rtNew); 
}//for пор) 


return vecRECT; //jkK || 7 #“` r Ж ЕЗЕР УЕ Ж 


Y H ObjectSegmentOQ KAŽEM EIT ЖШН ЛУ 
代码 如 下 。 


m_vecRT = m_OCRImg.ObjectSegment(); // 字 人 符 分 割 





字符 分 割 后 的 效果 如 图 15.28 所 示 。 


102o30123456701s78765437652765017623889 
415.28 ”字符 分 割 效果 


6) 49—16 
—COCRImageProcess::ObjectNorm 


扫 插 图 像 中 的 数 子 子 从 可 能 大 小 个 一 ， 而 后 续 
ANN 的 训练 和 识 列 部 需要 统一 尺寸 的 学 从 对 象 ， 
此 有 必要 对 字 从 进行 归 一 化 处 理 ， 使 其 其 有 相同 的 
Гру" 


归 一 化 函数 ObjectNormO 使 用 在 字符 分 割 中 获 
得 的 定形 轮廓 癌 量 作为 翘 入， 对 于 每 个 包含 字符 的 
算 形 轮廓 区 域 ， 以 该 定形 rt 为 参数 调用 RgnZoom0) 
РЁ Ж KR] k J X ЕН {Ж ж #l|nTargHeight 
xnTargWidth 的 标准 大 小 。 


疯 数 的 其 体 实现 如 下 。 





站 


void COCRImageProcess::ObjectNorm(COCRImageProcess* pTo 
， int nTargWidth, int nTargHeight, vector<RECT> &vecRT ) 
功能 : 对 各 个 对 象 进行 斥 寸 的 归 一 化 处 理 ， 以 他 们 其 有 相同 的 宽 
和 高 ， 以 方便 特征 的 提取 。 

应 在 提取 了 对 象 轮廓 矩形 乙 后 使 用 
注 : 只 能 处 理 2 值 图 像 

需要 滤 形 轮 慷 问 量 作 为 输入 参数 ， 应 在 提取 了 对 象 轮廓 窍 形 之 


后 使 用 
参数 : COCRImageProcess* рТо: 目标 图 像 的 COCRImageProc 
ess 指针 
nTargwidth: 归 一 化 的 目标 宽度 
nTargHeight: 9—10 Н 
vecRT: EI FITO u BJ EJE А EAH 
返回 值 ， Ж 


和 


void COCRImageProcess::ObjectNorm(COCRImageProcess* pTo 
› int nTargWidth, int nTargHeight, vector<RECT> &vecRT) 
l 

pTo->InitPixels(255); // НЖЖ A 

int nSize = vecRT.size(); //ХЙ М R (r) МЕА H 


/ [EBENE БЕЛЕ JÉ ИЕ JV У 
for(int nObj=0; nObj<nSize; nObj++) 


ВЕСТ rt = vecRT[nObj]; // 取 得 一 个 轮廓 矩形 
уесАт [побу | = RgnZoom(pTo, nTargWidth, nTargHeight 
, агі); 


) 


Я: Коплоот()в ZX H ХА 
ЈА, 4825 H Pr е БАЕК PC Pk Z: ЕШ 
AAE w упТагаміаһ і, ту /JnTargHeight 
ЈАЈА. я СЛ IT HE HJ ЛП Н PR 
ш, VL Ar Н КУР Л aj 38) X S dXScale 和 坚 
直方 向 的 缩放 因子 dYScale ; 而 后 在 输出 图 像 的 日 
标 区 域 中 逐 行 扫 摘 ， 计 算出 对 应 的 原 坐 标 ， 完 成 像 
ЖН, EMAN. ЖИК К. 


i uu ЕЕЕ ЕЕ ЕЕЕ В 

void COCRImageProcess::RgnZoom(COCRImageProcess* pTo, i 
nt nTargWidth, int nTargHeight, LPRECT lpRect) 

功能 : 将 pTo 指向 的 图 像 中 由 lpRect 指示 的 和 矩形 区 域 缩放 置 
nTargWidth %, nTargHeight 高 


注 : 只 能 处 理 2 值 图 像 ，nTargWidth 和 nTargHeight 给 出 的 
大 小 不 能 超出 图 保 范 围 

参数 : COCRImageProcess* pTo: 目标 图 像 的 COCRImageProc 
ess 指针 


nTargwidth: 归 一 化 的 目标 宽度 
nTargHeight: 归 一 化 的 目标 高 度 
lpRect: 标准 化 缩放 之 前 的 轮廓 定形 
返回 值 : Я НӘР ЕЁ 
ккк EEEE EEE ET EEE TE 
RECT COCRImageProcess::RgnZoom(COCRImageProcess* pTo, i 
nt nTargWidth, int nTargHeight, LPRECT lpRect) 
l 
RECT retRT; //@Л НЕ 
double dXScale; ///K-F 27 0] АЈА АҒ 
double dYScale; //'!E #219149 
int is J; 


ГГА 

dXScale = (double)nTargWidth / (lpRect->right - 1р 
ect->left + 1); 

dYScale = (double)nTargHeight / (lpRect->bottom - 1 
pRect->top + 1); 


int nSrc_i, nSrc_j; // 映 射 源 坐标 


PetRT .top = lpRect->top; 

retRT .bottom = FetRT .top + nTargHeight; 
retRT.left = lpRect->left; 

retRT.right = retRT.left + nTargMWidth; 


// 对 新 图 像 逐 行 扫 拉 ， 通 过 像 系 映射 完成 缩放 
for(i=retRT.top; i<retRT.bottom; i++) 


l 
for(j=retRT.left; j<retRT.right; j++) 


{ 
/ / Т Ж.Н У Н А ЁЛ (ЖН ИН) 
п5гс_1 = retRT.top + int( (i-retRT.top) / dYScal 
е); 
nSrc j = retRT.left + int( (j-retRT.left) / dXSc 
ale ) ; 


/ / ЎЛА жа ПАЛЕ. 
int пбгау = GetGray(nSrc j, п5гс_1); 
pTo->SetPixel( j, i, RGB(nGray, nGray, nGray) ); 
}//for j 
}//for i 


return retRT; 


调用 ObjectNorm () РА 5516 27/040 
相应 代码 如 下 。 


m OutOCRImg.ImResize(2*m OCRImg.GetHeight(), 2*m OCRImg 
.GetwWidthPixel())3;// 扩 大 目标 图 像 ， 防 止 归 一 化 后 超出 范围 

m OCRImg.ObjectNorm(&m OutOCRImg, ІМС WIDTH, IMG HEIGHT 
‚ m_vecRT); // 归 一 化 为 统一 大 小 


// 其 中 IMG_WIDTH 和 IMG_HEIGHT 分 别 为 预 设 的 图 像 标 准 宽 、 高 ， 在 D 
igitRec.h 中 被 定 以 ; m_vecRT 是 视 
// 图 类 中 你 存 字 从 滤 形 的 同 量 数组 





是 是 
由 于 归 一 化 会 改变 字符 的 大 小 ， 在 调用 ObjectNormO 国 数 之 前 ， 需 


要 站 先 调 用 ImResize(0) 函 数 将 图 像 尺 寸 扩 大 一 倍 ， 以 防 字 符 在 改变 大 小 
后 超出 图 像 范围 。 


经 过 归 一 化 处 理 的 字符 图 像 如 图 15.29 所 示 。 
1429301234567017876- 4 37654765017623889 


415.29 ”字符 归 一 化 效果 
(7) НЕА 


经 过 归 一 化 处 理 后 的 字符 在 向 像 中 的 排列 没有 
规律 ， 这 给 后 续 的 字符 样本 所 取 增加 了 工作 量 。 因 
此 ， 这 里 偿 要 对 字符 进行 系 缩 和 对 章 ， 
ObjectAlignO 用 于 完成 此 项 工作 ， 其 完整 实现 如 


О 





u usa kia ЕЕ ЕКЕ 


void COCRImageProcess::ObjectAlign(COCRImageProcess* pT 
O, vector<RECT> &vecRT) 
功能 : 日 标 对 象 〈 字 从) WAAN, 09—06: А18 Н 
注 : 只 能 处 理 2 值 图 像 
人 参数: COCRImageProcess* pTo: 目标 图 像 的 COCRImageProc 
ess 指针 
vecRT: 表示 字符 分 割 的 窍 形 癌 量 数组 
返回 值 ， Ж 


кеке ЕЕЕ 7А 


void COCRImageProcess::ObjectAlign(COCRImageProcess* pT 
O, vector<RECT> &vecRT) 


l 


排列 


f 


pTo->InitPixels(255); // НЖЖ АН 


int nHeight = GetHeight(); 
int nWidth = GetWidthPixel(); 
int i, j; 


int nSize = vecRT.size(); //ЯХЁ ЮМ Ж (r) IEI te RR H 


int nNormW, nNormH; // H-Z EREE та 
/ [RAR а НИЈЕ. 1 
if( nSize > Ө ) 
l 
nNormW = vecRT[0].right - vecRT[9].left + 
nNormH = vecRT[9].bottom - vecRT[0].top + 


P = 
чөө Wo 


} 
else / /没有 轮 廊 矩形 ， 直 接 返 回 


return; 


int nSrc_i, nSrc_j; // 映 射 源 坐标 
RECT rt, rtNew; 
int nMargin = 2; // XXT ШЕЙ ШШ ЛЕ, ЕЯ 


ГКЗ RR $ç БАЕ JZ X ЖУ. EL 
for(int nObj=0; nObj<nSize; nObj++) 
l 
rt = vecRT[nObj]; 
// 紧 缩 对 齐 后 的 轮廓 算 形 ， 从 图 像 和 直上 角 开 始 ， 从 直至 右 依次 


rtNew.left = nObj * nNormW + nMargin; // 左 边界 
rtNew.right = (nObj+1) * nNormW + nMargin; // 右 边 


rtNew.top = 6 + nMargin; // 上 边界 


rtNew.bottom = nNormH + nMargin; // ГЛ 
vecRT[nObj] = rtNew; 


ЈЕЛЕ ру BJ Ж Pk Hh т tJ a Jë | 


for(i=0; i<nNormH; i++) 
for(j=nObj*nNormW; j<(nObj+1)*nNormW; j++) 


// 计 算 映 冉 源 坐标 


nSrc 1 = rt.top + i; 
nSrc ] = rt.left + j - nObj*nNormW; 
// 复 制 像 系 


int nGray = GetGray(nSrc j, nSrc i); 
pTo->SetPixel(j+nMargin, i+nMargin, RGB(nGray, 
nGray, nGray)); 
y// for j 
}// for i 
y//for nObj 


11 HJObjectAlign() AAEM 4 2 А А] ЭХ WJ #H 
应 代码 如 下 。 





经 过 案 顷 和 对 章 的 子 从 图 像 如 图 15.30 所 示 。 





415.30 ”紧缩 对 齐 后 的 效果 


(8) 你 存 训 练 /测试 样本 


ТЕТТЕ ЖАНА ҤЕ а, т ЕТ УР 
形 区 域 中 的 数字 分 列 保存 为 蛙 独 的 图 像 文 件 ， 得 到 
和 15.3.2 小 市 中 相同 的 数据 集 ， 以 便 程 序 可 以 直接 
使 用 。 此 时 可 以 分 为 训练 图 像 的 预 处 理 和 测试 图 保 
的 预 处 理 两 种 情况 来 考虑 ;处理 训练 图 像 时 需要 根 
据 各 个 数字 所 属 的 类 别 〈 由 用 户 在 “图 像 预 处 理 ? 对 
话 框 中 指定 包含 训练 样本 类 标签 的 文本 文件 ) 将 它 
们 分 门 别 类 地 你 存 全 训练 分 类 目录 (由 用 户 指 
定 ); 而 处 理 测试 图 像 时 只 需要 将 各 个 数字 全 部 你 
存 全 测试 目录 (由 用 户 指定 ) 。 
对 应 于 菏 个 训练 样本 图 像 ， 在 包含 训练 样本 类 标签 的 文本 文件 

中 ， 只 需 以 空格 分 割 开 按照 图 像 中 从 左 到 右 的 顺序 排列 的 各 个 数字 的 

类 别 标 号 即 可 。 例 如 对 于 网 15.24， 对 应 的 类 标签 文件 labels 的 内 容 为 : 


19293012345670167876543765476501762388 


CO 


2% Juk FE KISAH KASS F, ЖР 
bTrain tR pas H Г ТЕ“ {@ ТИ aE E” XT ТЕЛЕН Т AA 
而 得 到 的 bool 型 变量 ， 为 true 表 示 训 练 图 像 的 预 处 


BB, fasean WNA SA J H АЕ, 


if(bTrain) // 是 人 否 是 训练 模式 
SaveToTrainDIR(strDIR); // 保 存 人 至 训练 分 类 目 孙 
else 


SaveToTestDIR(strDIR); // 保 存 至 测试 目录 





2， 预 处 理 函 数 


视图 类 函数 OnPreprocess() 封 装 了 上 述 8 个 预 处 
理 步 又 ， 其 县 体 实 现 如 下 。 


void CDigitRecView::OnPreprocess() 


// 取 得 预 处 理 相 关 的 参数 

int nThres; // АИНУ ИН 

int пуррег, nLower; // 去 除 离散 噪声 时 的 上 、 下 限 СКЕпи 
pper 或 小 于 nLower 的 被 作为 噪声 滤 除 ) 

CString strLabelFilePath; // 类 别 标签 文件 的 路 径 信息 

CString strDIR; // 你 和 存 训练 样本 的 分 类 目录 

bool bTrain; // 十 否 是 训练 集合 的 预 处 理 


CPreprocessDlg DlgPara; 
if( dlgPara.DoModal() != IDOK) 
return; 
else 
// МЕ HHX G H] Р ВЈ 8. 
nThres = dlgPara.m nThres; // 二 值 化 国 什 
nUpper = dlgPara.m nUpper; // 去 除 噪声 时 的 连通 区 域 上 
车 通 


ВК 
nLower = dlgPara.m піомег; // ЖЖ ЕЁ Н НЕШ DC bk F 


ВК 


strLabelFilePath = dlgPara.m strClassLabel; // 训 练 


集 样 本 的 类 标签 文件 


Ж 
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strDIR = dlgPara.m_strTrainFile; // 训 练 或 测试 集 的 日 


bTrain = dlgPara.bTrain; // 训 练 模 式 还 是 测试 模式 
} 
// 从 奖 别 标 俭 文 件 谈 取 类 别 标签 信息 


if(bTrain) 
ReadClassLabels(strLabelFilePath); 


// ТУКЕ 

COCRImageProcess OCRImgBk = m OCRImg; // 原 始 图 像 备 份 
т OutOCRImg = m OCRImg; 

m OCRImg.Threshold(&m OutOCRImg, nThres); // 二 值 化 处 
т OCRImg = т OutOCRImg; 


m OCRImg.DelScatterNoise(&m OutOCRImg, nLower, nUpp 


er);// 云 除 离散 噪声 点 


m OCRImg = т OutOCRImg; 


m OCRImg.SlopeAdjust(&m OutOCRImg); // 倾 斜 度 调整 
т ОСКІте = m_OutOCRImg; 


m_vecRT = m_OCRImg.ObjectSegment(); // 字 人 符 分 割 


m OutOCRImg.ImResize(2*m OCRImg.GetHeight(), 2*m OC 


RImg.GetWidthPixel()); 
// 扩 大 目标 图 像 ， 防 止 归 一 化 后 超出 范围 


m OCRImg.ObjectNorm(&m OutOCRImg, IMG WIDTH, ТМС НЕ 


IGHT, m vecRT); 
// 归 一 化 为 统一 大 小 


m_OCRImg = m_OutOCRImg; 


m OCRImg.ObjectAlign(&m OutOCRImg, m vecRT); // TIF 
对 齐 


m OCRImg = OCRImgBk; // 复 原 原 始 图 像 


m_bOut = 1; // 切 换 到 显示 输出 图 像 的 模式 
Invalidate(); 


if(bTFain)// 是 个 是 训练 模式 
SaveToTrainDIR(strDIR); // 保 存 人 至 训练 分 类 目录 
else 
SaveToTestDIR(strDIR); // 保 存 至 测试 目录 


} 


上 述 程序 运行 后 ， 首 先 弹 出 对 话 框 ， 让 用 户 答 
入 相关 参数 。 访 着 可 以 通过 光盘 示例 程序 DigitRec 
中 的 菜单 命令 “神经 网 络 数字 识别 — 预 处 理 ? 束 观察 
处 理 效果 。 


15.6.3 ”输入 图 像 的 预 处 理 一 -测试 


运行 DigitRec 后 ， 打 开 一 幅 扫 朱 数 字 字 从 图 像 
(这 里 为 scanDigit.bmp， 读 者 可 在 随 书 光 极 
Hj‘\chapter15” 目 录 中 找到 该 文件 ) ， 早 击 “ 神 经 网 
络 数 字 识 别 * 采 时 下 的 “ 预 处 理 ” 命 令 ， 弹 出 “图 像 预 
处 理 ” 对 话 框 ， 如 图 15.31 所 示 。 
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415.31 图像 预 处 理 对 话 框 
1. 训练 图 像 的 预 处 理 


ТЕ“ ТИЯР” ТЕЛЕН, УЕ МЕЛ ИЕ LA 
ERS НАШЕ Е] ХЕЛ [Ху Е. ад Ох 
Н 1Ж БАШЫН ; 接 看 选择 包含 训练 样本 类 列 
标签 的 文件 和 训练 分 类 目 孙 的 位 置 ; 了 节 后 选择 “ 训 
练 " 里 选 授 钮 ， 如 图 15.32 所 示 。 
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415.32 ”训练 样本 预 处 理 时 对 话 框 的 设置 
蛙 击 “确定 ”按钮 ， 将 触 太 OnPreprocess() 函 数 进 
行 训 练 图 像 的 预 处 理 ， 并 将 预 处 理 结果 分 门 列 类 地 
你 和 存 全 训练 分 类 目 杂 中 (这 里 为 “E:\ScanTrain”) 。 


预 处 理 后 的 字符 效果 如 图 15.33 所 示 。 


ЖҮР) SEO) ЕРДЕ] А) Wt 


10293012345670178 








415.33 ЖНА 


此 时 在 训练 分 类 日 录 〈“ 下 :\ScanTrain”)〉 中 出 现 
了 了 10 个 子 上 日 录 ， 每 个 子 目 录 对 应 一 个 类 别 ， 其 中 包 
售 了 该 类 的 所 有 有 训练 样本 ， 如 图 15.34 所 示 。 
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415.34 训练 分 类 目录 〈 缩 略图 模式 ) 
2. 测试 图 像 的 预 处 理 


需要 对 测试 图 像 进行 和 对 训练 图 像 相 同 的 预 处 
理 。 运 行 DigitRec， 打 开 一 幅 测 试图 像 (这 里 为 
scanDigit_testbmp， 谈 者 可 在 随 书 光 盘 
‘chapter15” 目 杂 中 找到 该 文件 ) ; 早 击 “神经 网 
络 数 字 识 别 * 玉 持 下 的 “ 预 处 理 ”* 命 令 ， 在 弹出 的 “图 
像 预 处 理 ” 对 话 框 中 ， 设 定 和 训练 图 像 预 处 理 时 相 
АЈ EK RE AAK E R A HY loa = HJ BJ 6 88 D< Pak HJ 
上 上 上、 下 限 信息 ; 接 看 选择 汕 话 目 孙 的 位 置 ; 节 后 选 
择 “ 测 试 ? 单 选 按钮 ， 如 岁 15.35 上 所 示 。 


RGB£FZK EZ 
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415.35 ”测试 样本 预 处 理 时 对 话 框 的 设置 


ЕЕН, ЖШ ОпрРгергосеѕѕ() РЁ 229+ 
行 测 试图 像 的 预 处 理 ， 并 将 预 处 理 结果 你 存 全 测试 
目录 (这 里 为 下:\ScanTest”) rH. 


15.7 ”神经 网 络 参 数 对 训练 和 识别 
ШЕШ 


本 节 主 要 通过 实验 来 考察 如 隐藏 层 单元 数目 、 
学 习 率 以 及 训练 时 代数 目 等 参数 对 于 系统 训练 和 识 


列 的 影 啊 。 
15.7.1 Б лс Н ВЈ ЕЦЩ 


PAZARA -Р15.677 Н { [КУЛШ ТАЕ, 
ЧА ANNHJË8 Ж 2 Pa. л Н 275] 2845105] ХУ 
进程 和 测试 集 上 识别 率 的 影响 。 


1. 对 于 训练 进程 的 影 啊 


设 定 最 大 训练 时 代数 为 8000， 误 差 冰 值 0.001， 
^2] 25 770.1, Б >05 H Ж4: 选择 训练 样本 
分 类 目录 所 在 的 位 置 OXE 5“Е:\5$сапТтаїп”) ; 新 
建 一 个 配置 文件 “hidden 4.net”。 


训练 开始 后 ， 当 樟 度 下 降 算 法 友 代 到 设 定 的 最 
大 时 代数 8000 时 ， 训 练 结 束 ， 此 时 的 误差 为 
0.003387， 训 练 过 程 总 共 耗 时 33s。 误 甜 随时 间 变 化 
的 曲线 如 图 15.36 所 示 。 


将 隐 蕊 层 蛙 元 增加 人 至 10 个 ， 其 他 参数 不 变 ， 新 
建 一 个 配置 文件 “hidden 10.net”。 训 练 历时 14s 束 在 
第 1688 次 友 代 时 达到 误 甜 要求， 从 而 捉 前 结束 。 此 
时 的 误差 随时 间 变 化 曲线 如 图 15.37 所 示 。 





Ш АЕА Ее, В: 8001, 13=:0. 003387 


415.36 ”隐藏 层 单元 数 日 为 4 时 训练 误差 的 变化 曲线 





训 暑 误差 随时 间 的 变化 Rit: 1688, i% 0. 001000 


415.37 Ka EI H 7910812 AE IAEE HH 24 


ма ag Б ва. 7с 230258, VIZ£/ZF4812%325 
代 时 结束 ， 历 时 11s。 

当 隐 藏 层 单元 增加 至 100 个 时 ， 训 练 在 347 次 迭 
代 时 结束 ， 历 时 26s。 过 多 的 隐藏 层 蛙 元 使 得 网 络 
权 值 数 剧 增 ， 从 而 导致 训练 时 间 的 增加 。 


SEE 


5 


由 于 每 次 训练 的 初始 权 值 是 随机 得 到 的 ， 按 照 上 面 的 参数 设 定 重 
复 本 实验 时 ， 可 能 得 到 不 完全 相同 的 结果 。 


2. 对 于 测试 集 识别 率 的 有 影 啊 

分 别 使 用 上 面 训练 的 4 个 网 络 对 测试 集 (这 里 
为 “EScanTest”) 中 的 20 个 样本 进行 识别 的 结果 如 
表 15.2 所 示 。 


表 15.2 不 同 隐藏 层 单元 数目 的 4 个 ANN 在 测试 集 上 的 识别 率 





hidden 30.net 
hidden 100.net 


可 以 看 到 ， 一 味 地 增加 隐藏 层 数目 并 不 一 定 能 
Бете ИАЛ, БЕШП ЖОЛ ФК] ТАЈ АЧ Т ЗЕН 
多 的 网 络 权 值 容 易 造成 对 训练 样本 的 过 度 拟 合 “〈 庄 
见 15.7.3 小 节 ) à 





15.7.2 2] HIK 


设 定 最 大 训练 时 代数 为 100000， 误 天 国人 
0.002, 2770.2, л Н 774; 新建 一 


个 配置 文件 “drEita.net”。 


单 击 “ 训 练 ? 控 钮 开始 训练 后 ， 可 以 发 现在 训 疆 
急 期 〈 时 代数 目 <1000) WAER R; AMSA 
速度 开始 放 缓 ， 并 在 时 代数 为 6000 元 右 时 变 得 相当 
2; 随 腹 训练 的 持续 进行 ， 当 时 代数 运 到 20000 
左右 时 ， 其 全 明显 出 现 了 类 似 于 图 15.7(c) PIR 
差 不 降 反 增 的 情况 ， 如 图 15.38 所 示 ， 这 是 由 相对 较 


KWAK Pri БЁН 
注意 
由 于 每 次 训练 的 初始 权 值 是 随机 得 到 的 ， 按 照 上 面 的 参数 设 定 重 
复 本 实验 时 ， 可 能 得 到 不 尽 相 同 的 结果 ， 但 主要 的 误差 变化 趋势 是 一 
致 的 。 







时 代数 达到 20000 左右 时 ， 
误差 曲线 开始 出 现 明 显 的 
跳跃 。 高 于 主 曲 线 的 误差 
散 点 对 应 着 误差 的 增 大 











轻微 的 跳跃 


训 绪 误 差 随时 间 的 变 作 ВТЕ :23Т96, 1<2=:0. 002743 


415.38 “误差 变化 


以 上 情况 说 明了 较 大 的 学 习 圣 中 能够 在 训练 饭 
期 加 局 收 伍 进程 ， 然 而 在 训练 后 期 却 会 芒 信 误 甜 的 
充分 收敛 ; MENFI KN 虽然 有 利于 后 期 的 元 
DAA, BREEDTE AR E 


АЩ, EMRE 7616 ВХА; 341572 
ЖЕ РАК IF, а РАТ: 将 学 
习 率 重新 设 定 为 0.1 继 续 训 练 ， 此 时 误差 不 再 跳跃 ， 
而 是 开始 继续 减 小 ， 随 看 训练 的 进行 ， 当 误 牵 义 开 
始 在 茶 个 全 附近 “徘徊 ?时 ， 可 以 根据 情况 进一步 减 
小 n 的 全 《如 0.05) 。 


15.7.3 ”训练 时 代数 目的 影响 


分 别 设 定 最 六 训练 时 代数 为 8000、12000 和 
20000， 其 他 保留 默认 设置 ， 将 训练 得 到 的 3 个 网 络 
分 别 用 于 分 类 测试 集合 (‘下 :\ScanTest”)〉 的 结果 如 
表 15.3 所 示 。 


表 15.3 ”不同 训练 时 代数 目的 3 个 ANN 在 测试 集 上 的 识别 率 


ANN 的 配置 文件 训练 时 代数 | 训练 误差 | 测试 集 上 的 识别 率 





2 hidden_4 epoch 12000.net 12000 0.003027 |90% 
3 hidden_4 _ epoch 20000.net 20000 0.002893 


从 表 15.3 中 可 以 看 出 随 看 训练 时 代数 的 增加 ， 
训练 误 到 不断 减 小 ， 但 测试 集 上 的 错误 卒 却 先 减 
小 ， 后 增加 ， 表 明 一 味 增加 训练 时 代数 将 过 成 网 络 
对 于 训练 集 的 过 度 拟 合 。 


2. 过度 拟 合 (Overfit) 和 停止 判 据 


图 15.39 展 示 了 两 个 比较 典型 的 反问 传播 算法 应 
用 中 误差 E 是 如 何 随 着 训练 时 代数 变化 的 。 在 图 
15.39 (a) ~ 15.39 (b) 中 ， 由 “…”* 组 成 的 曲线 显 
示 了 在 训练 集合 上 的 误 关 已 随 训练 时 代数 的 增加 而 
单调 和 下降; 而 由 “+” 组 成 的 曲线 是 在 独立 测试 集 上 
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训练 集 误差 。 
验证 集 误差 + 
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415.39 ”训练 和 验证 误差 随 训练 时 代数 的 变化 情况 


从 图 15.39 中 可 以 注意 到 图 15.39 (а) 中 的 测试 
误 和 看 忌 体 呈 持 续 下 降 趋 势 ， 但 图 15.39(b)》 中 则 出 
现在 测试 集 上 的 误 牵 E w r, ma ERWIES 
现象 。 这 是 因为 网 络 权 值 拟 合 了 训练 样本 的 特殊 
性 ， 而 这 些 特殊 性 对 于 一 般 样 本 不 具有 代表 性 。 正 
是 ANN 网 络 中 的 大 量 权 信 为 拟 合 训练 样本 的 特殊 性 
提供 了 很 大 “便利 ”。 


过 度 拟 合 一 般 在 训练 的 后 期 开始 出 现 ， 这 征 因 
为 Sigmoid 函 数 在 小 输入 情况 下 的 关 似 “线性 ?”， 而 将 
网 络 权 值 初始 化 为 一 些小 的 随机 数 ， 使 得 在 训练 初 
期 形成 的 决策 面 通常 是 比较 平 消 的 。 而 随 看 训练 的 
进行 ， 一 些 权 值 开始 增加 ，Sigmoid 函 数 的 非 线性 
АЕА ЕҢ че, ЛЕ Fk t ЫШ HJ £ 284 2 A" ru 
т, СЕЛ RARER, Ë 
至 拟 合 了 训练 数据 中 的 噪声 和 训练 样本 中 没有 代表 
性 的 特征 ， 寻 致 了 过 度 拟 合 的 出 现 。 


ЉУБЕ РЕЙД, КА НИЈЕ 301212 
的 最 小 化 ，DigitRec 中 通过 设 定 一 个 最 大 时 代数 目 
来 限制 训练 的 过 度 进行 。 然 而 ， 对 于 最 大 时 代数 的 
指定 还 缺乏 一 个 客观 的 原则 来 指导 ， 区 叉 验 证 为 读 
者 提供 了 这 样 一 种 确定 训练 时 代数 目的 方法 。 


3. X XUE (Cross Validation, CV) 


为 了 有 效 防 止 过 撒 拟 合 的 出 现 ， 一 个 被 三 泛 米 
用 的 方法 是 kK Т5 ХУУ МЕ СК -fold Cross 
Validation〉， 它 每 次 使 用 数据 的 不 同 分 割 作 为 训练 
集合 和 测试 集合 ， 然 后 对 结果 进行 平均 。 例 如 ， 对 
于 含有 NN 个 样本 的 数据 集 ， 首 先 分 割 为 k 个 不 相交 
的 子 集 ， 每 个 子 集 NW/k 个 样本 。 然 后 ， 运 行 k xë 
叉 验 证 过 程 ， 每 次 使 用 1 个 不 同 的 子 集 作 为 测试 
集 ， 将 其 余 的 k -1 个 子 集合 并 作为 训练 集 。 每 次 交 
又 验证 的 目标 都 是 找到 能 人 够 在 测试 集 上 产生 最 小 误 
天 的 训练 时 代数 ， 因 为 这 是 网 络 对 于 独立 的 测试 集 
合 性 能 评估 的 最 好 标准 。 


具体 实现 时 需要 在 训练 中 权 信 更 新 的 同时 总 是 
你 留 到 目前 为 止 性 能 最 好 《〈 对 测试 集 误 甜 最 低 ) 的 
权 值 的 备份 ， 以 一 定 的 训练 时 代数 作为 国 值 7， 一 
旦 训练 新 得 到 的 权 值 在 测试 集 上 的 误 大 比 体 存 的 当 
前 最 佳 权 值 误 到 品 ， 并 且 当 前 时 代数 大 于 T， 训 练 
束 彼 终止 。 些 时， 返回 到 目前 为 止 对 应 于 最 小 测试 


集 误 差 的 训练 时 代数 e G =1,2,...,k ) 作为 第 i 次 交 
又 验 证 的 最 优 训 练 时 代数 。 当 所 有 Kk 次 交叉 验证 结 
束 后 ， 计 算 这 些 e; 的 均值 “各” ， 最 后 运行 一 次 
反问 传播 算法 ， 将 所 有 N 个 样本 作为 训练 集合 (此 
时 没有 测试 集合 )， 训 练 时 代数 为 : ， 将 得 到 的 模 
型 作为 最 终 的 ANN 分 类 模型 。 


51651 ” 文 持 问 量 机 

ж 19] ЛЛ, (Support Vector Machine, SVM) 
是 在 统计 学 习 理 论 的 基础 上 友 展 起 来 的 狐 一 代 学 习 
算法 ， 它 在 文本 分 类、 手 与 识别 、 图 像 分 类 、 生 物 
信息 学 等 领域 中 获得 较 好 的 应 用 。 相 比 于 容易 过 上 度 
拟 合 训练 样本 的 人 工 神 经 网 络 ， 文 持 癌 量 机 对 于 未 
见 过 的 调 弃 样本 有 共有 蝎 好 的 推广 能 


(Generalization Ability) 。 
本 章 的 知识 和 技术 热点 

(1) SVM 的 理论 基础 

(2) МР 

(3) SVM#EJ | 2 |а] НЗ И ЕЕ 
А.т р) 0 ЖИТ 


基于 PCA 和 SVM 的 人 脸 识 别 系统 


16.1 жг ЕЛЬ? 88 
传统 模式 识别 技术 只 考虑 分 类 器 对 训练 样本 的 


Ил, МИТ ЕНУ у Н PR 
ЖЧ КЕ е DK Zü е НУУ АКТА E 27 
Жа А АО ВАК Е НАЛ] 4 ЯХ, ХРА 
量 的 训练 样本 集合 来 说 ， 不 能 你 证 一 个 很 好 地 分 闫 
T ПАНУ ат ВЕ ДВ ТАРЕ. 
ТЕЙ ЙМ ЕТЕН ЛУУ# АЧ, F, R КК 


ЖГ тн RMA ОЧИ ЕГ - 


ЗСУ Пар Д А ЫА ве ЈМ у Ја Л], RARE 
2 (ARAW) BARE HEKE ) 
Нуе, BEEE NRA НОЛА EA 2 2:25 
的 选择 上 。 


1. 分 类 模型 的 选择 


要 分 类 如 图 16.1 (a》 所 示 的 两 类 样本 ， 可 以 看 
到 图 中 的 曲线 可 以 将 图 16.1 (a》 中 的 训练 样本 全 部 
分 类 正确 ， 而 直线 则 会 错 分 两 个 训练 样本 ， 然 而 ， 
对 于 图 16.1(b》 中 的 大 量 测试 样本 ， 简 单 的 直线 模 
型 却 取得 了 更 好 的 识别 结果 。 应 该 选择 什么 样 的 分 
类 模型 呢 ? 


ы ө f 
e O ` @ © / 
/ q / 

/ О О N © / O 
` / 

/ O N: O 
O O O 

(a) 训练 样本 上 的 两 种 分 类 模型 (b) 测试 样本 上 的 两 种 分 类 模型 


416.1 分 类 模型 的 选择 


图 16.1 中 复 林 的 曲线 模型 过 度 拟 合 了 训练 样 
本 ， 因 而 在 分 关 测 试 样本 时 效 末 并 不 理想 。 在 第 
14.1.5 小 市 ， 了 解 到 通过 控制 分 类 栋 型 的 复 末 性 可 
以 防止 过 度 拟 合 ， 因 此 SYM 更 偏爱 解释 数据 的 简单 
模型 一 一 二 维 空间 中 的 直线 、 三 维 空间 中 的 平面 和 
E тау = (иу ңа у 


2. 模型 参数 的 选择 
如 多 16.2 押 示 为 二 维 空间 中 的 两 突 样 本 ， 可 以 


采用 图 16.2 (a) 中 的 任意 直线 将 它们 分 开 。 哪 条 和 直 
线 才 十 最 优 的 选择 呢 ? 











$ ` 
Коча 
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(а) 任意 分 割 超 平面 (b) 最 佳 分 割 超 平面 
416.2 ”分割 超 平面 


АХ Е, АЕА КАТ ЈАТ ра 
比较 敏感 ， 且 对 训练 样本 之 外 的 数据 不 太 可 能 归纳 
得 很 好 ; 而 远离 所 有 训练 样本 的 分 类 线 将 可 能 其 有 
БЕЛАЯ ВЕ Л» WH NTR, H 1. H 22] у 
26 732626 JEFE HFT FKA 
Zk, ШН1УН 22 [н] Н s НЧЕ Їн] CARA 
余地 ，Margin) „ РЁ 77246 0л 286732626 
不 但 能 将 两 类 正确 分 开 〈 训 练 错 误 率 为 0) , Im H 
使 分 类 间隔 最 大 ， 如 图 16.2 (b) 所 示 。 分 类 线 的 方 
Ууу I х+р= 0. 


图 16.2 只 是 在 二 维 情况 下 的 特例 取 优 分 类 
线 ， 在 三 维 空 间 中 则 是 具有 最 大 辐 隅 的 平面 ， 更 为 
一 般 的 情况 是 最 优 分 次 超 平面 。 实 际 上 ，SVM 正 是 
从 线性 可 分 情况 下 的 最 优 分 类 面 及 展 而 来 上 的 ， 其 主 








За МУЛШ sy НЕ У IRTI РЧ К ЭР H. ЯН Ж 
大分 舌 间 隅 的 最 优 分 闫 超 平 面 。 


寻找 最 优 分 关 面 的 算法 最 终 将 转化 成 为 一 个 二 
次 型 寻 优 问题 ， 从 理论 上 说 ， 得 到 的 将 是 全 局 最 优 
扩 ， 人 解决 了 在 神经 网 络 方法 中 无 法 避免 的 局 部 极 值 


їн] жй; 


16.2 ”支持 同 量 机 的 理论 基础 


本 节 主 要 介绍 SVM 的 理论 基础 和 实现 原理 ， 将 
分 别 曾 述 线性 可 分 、 非 线性 可 分 以 及 需要 核 水 数 映 
射 的 这 3 种 情况 下 的 SVM。 最 后 还 将 学 习 如 何 将 
SVM 推广 至 多 类 问题 。 


16.2.1 线性 可 分 情况 下 的 SVM 


如 果 用 一 个 线性 函数 《如 二 维 空间 中 的 直线 、 
三 维 空间 中 的 平面 以 及 更 高 维 数 空 间 中 的 超 乎 面 ) 
可 以 将 两 类 样本 完全 分 开 ， 束 称 这 些 梓 本 是 线性 可 
分 (Linearly Separable) 的 。 反 之 ， 如 宁 找 不 到 一 
个 线性 函数 能 够 将 两 类 样本 分 开 ， 则 称 这 些 样本 大 
非 线 性 可 分 的 。 


一 个 简单 的 线性 可 分 与 非 线性 可 分 的 例子 如 图 


16.3 所 示 。 


已 知 一 个 线性 可 分 的 数据 集 {(a1.). (ео). Enun) 
， 样 本 特征 向 量 z ERP, B|; 是 DD 维 实数 空间 中 的 
Jar; 类 标 丛 y C€ (-1, +1}， 即 只 有 两 类 样本 ， 此 时 
通常 称 类 标 低 为 +1 的 样本 为 正 例 ， 称 类 标签 为 -1 的 
样本 为 反例 。 


现在 要 对 这 两 关 样 本 进行 分 类 。 有 目标 驶 是 寻找 
了 最 优 分 割 超 平 血 ， 即 根据 训练 样本 确定 最 大 分 类 间 
也 的 分 割 超 平面 ， 设 最 优 超 平面 方程 为 :+z+b = 
0， 根 据点 到 乎 面 的 距离 公式 ， 样 本 s 与 最 住 超 半 而 
(ë, b) 之 间 的 距离 为 mi ， 注 意 通 过 等 比例 地 
缩放 权 矢 量 = 和 偏差 项 b ， 则 最 佳 超 平面 存在 着 许 
多 解 ， 对 超 平 面 进 行规 范 化 ， 选 择 使 得 距 超 平面 最 
ТЕ Же, WW AE tz, + |= 1 的 s 和 b ， 即 得 到 规范 化 
超 平 面 。 


此 时 从 最 近 样 本 到 边缘 的 距离 为 : 


Тл + 1 


iel 


ш| 





(16-1) 


HFR HME RIB 变 为 : 


"=l 


т. 





її 一 


=] 


(16-2) 


如 图 16.4 所 示 。 





(a) 线性 可 分 的 两 类 样本 (b) 非 线 性 可 分 的 两 类 样本 
图 16.3 ”线性 可 分 与 非 线 性 可 分 





416.4 ”最 佳 分 割 超 平 面 的 分 类 间隔 


人 至 此， 问题 逐 潮 明 天 化 ， 目 标 是 寻找 使 得 式 
(16-2) 最 大 化 的 法 回 量 = ， 之 后 将 zs 代入 关系 式 
+ 中 =1， 即 可 得 到 b 。 


最 大 化 式 (16-2) 等 价 于 最 小 化 : 


J lar) = = а)? 
2 


(16-3) 
除 此 之 外 ， 还 有 以 下 的 约束 条 件 : 
yil Ti +b) >21, мє {1,2,--- N) 
16-4) 
2 E [А] ЭН иШ r НУЛЕ АХ Але ТИ АЕ 
a+ 引 =1， 而 其 他 样本 点 a ЕЕ АЗРА АУЕН PS d (z; ) 
要 大 于 等 于 d (z, ), 因此 有 : 
tz, + b| >1 
(16-5) 


具体 地 说 ， 议 定 正 例 所 在 的 一 侧 为 超 平 面 的 正 
JTE, WAFER MRE Ey 为 +1 的 样本 ) 
有 : 


lz, + b| >1 
(16-6) 


而 对 于 反例 《对 应 区 标签 让 为 -1 的 样本 ) 


(ШТ, + b) <-1 
(16-7) 


在 式 (16-6) 和 式 (16-7) 的 两 端 分 别 乘 以 对 
应 其 a 的 类 标签 y; ， 由 于 对 应 式 (16-6) 和 式 (16- 
7) yd ееси 1， 因 此 得 到 式 〈16-4) 中 统一 


Е RIIN (16-3) FHJ НАРА (е) ИРА 
数 ， 意 味 着 只 存在 一 个 全 局 最 小 值 ， 因 此 不 必 再 像 
在 神经 网 络 的 优化 过 程 中 那样 担心 搜索 陷入 局 部 极 
小 值 。 现 在 要 做 的 束 是 在 式 (16-4) 的 约束 条 件 下 
找到 能 够 最 小 化 式 (16-3) 的 超 平面 方向 量 s < 
是 一 个 典型 时 条 件 极 值 问 题 ， 可 以 使 用 在 Рт 
中 学 习 过 的 拉 格 朗 日 乘 数 法 求解 。 


通过 对 去 (16-4) 中 的 每 一 个 约束 条 件 乘 上 一 
АЛУА ВН Н ЗЕ о: ， 然 后 市 入 式 (16-3) 中 ， 可 将 
此 条 件 极 值 问题 转化 为 下 面 的 不 受 约束 的 优化 问 
题 ， 即 关于 = 、D Moa: (i =1,2,...,N ) 来 最 小 化 工 。 


№ 
Іа, b,a) = a llu к. [yi UT T; + Б) — 1], а 


(16-8) 
求 L 对 和 b 的 偏 导 数 ， 并 令 其 等 于 零 : 


| | № 
Эга, b. | 
C ш, O. CY | [) 一 : Ti == > CT 


Си з 





(16-9) 


е5 
Өш. ÖL(w, b,a) ЭТЕ 


(16-10) 


N N 
L ЕЕ 
Lw, b.) = zU Ш З Сү; TATI т; — h у с; + у Сү; 


(16-11) 


再 将 式 〈16-9) 和 式 (16-10) 代入 式 (16- 
11), 8: 


N N N 
LW, b, œ) = 30 (> ө) — ШШ! 2 бз — Ü + Y a 
i=] 
= 一 了 > аш Ti) 十 > Ci 
| | N 
= — 7 2, Оу 9 ауу) Ti + 2, Gi 


NON 
Ысы; РЬ” аууу T; 十 Уа 


Дл = . b A I JJa: HJ РА ЖҮ, wN: 


= 


„ү N 
ИЙ 1 — T 
L(a) = g- у у MO YiYjT; Z; + у Сү; 


“© l j=l 1 


(16-12) 


ШЕ) 065: a> 0 并 且 ЭЕ 
(16-13) 


дЕ УФУ ВЯ H AA 18] ЖИ, У [a] i 
一 个 关于 。 的 凸 二 次 规划 问题 ， 可 售 助 一 些 标准 的 
优化 拉 术 求解 ， 这 里 不 下 评 细 讨 论 。 


和 
=. 


ДААЙ ШАЙЫ АКЕ Н Е (如 是 平面 法 癌 量 ， 对 每 维 有 1 个 系 
数 ) ， 然 而 对 伪 问 题 由 训练 数据 的 数目 决定 (每 个 样本 存在 一 个 拉 格 
ИННЭ а: ) ; 此 外 ， 在 式 (16-12) 中 ， 训 练 数据 只 作为 点 积 的 形式 
出 现 。 


在 解 得 , 之 后 ， 最 大 余地 地 分 割 超 平面 的 参数 
和 b 便 可 由 对 偶 问题 的 解 。 来 确定 : 


Ш == > Үү 
(16-14) 


在 样本 线性 可 分 的 情况 下 ， 由 于 有 关系 式 |=T， 
+b|=1， 其 中 是 任意 一 个 距离 最 优 分 类 超 平面 最 
近 的 向 量 ， 即 可 使 Wa+4 取 到 最 小 值 的 a 之 一 ， 故 
可 将 z 和 冯 代入 上 式 ， 从 而 求 出 b : 


Б = 1 -— min [u - T) р b= —1 — max (17: Z;) 
ы L “Ж, H = L: B 
ы =+1 i= y: =—1 


更 一 般 地 情况 下 (包括 16.2.2 小 节 的 非 线 性 可 
分 的 情况 )， 由 于 两 类 样本 中 与 分 割 超 平面 (w b ) 
的 最 近 距 离 不 再 一 定 是 1 且 可 能 不 同 ， 因 而 b 为 : 





416.5 Жш 
Е: 两 类 样本 的 文 持 同 量 分 别 НО” 


b= ——( min {w - z;) + max {ш-т;)) 
2 ш=+1 及 一 一 


(16-15) 
式 (16-15) 包含 了 线性 可 分 时 的 情况 。 


根据 优化 解 的 性 质 (Karush - Kuhn - Tucker 
Conditions), Ж. V ANN AE: 


орна 1=0, Yi=1,2, N 
(16-16) 


因此 对 于 每 个 样本 ， 必 满足 : о = 0 或 yj (6 +») 
-1=0。 从 而 对 那些 满足 y; ( 二 +9-1x<0 的 样本 二 对 应 
的 a; ， 必 有 a = 0; 而 只 有 那些 满足 y; 0 z+) - 1 =0BJ 
样本 对 应 的 ， 才 能 有 a >0。 这 样 ，a > 0 只 对 应 
那些 最 接近 超 平面 Oy; w+-1=0) 的 点 二， 这 些 点 
被 称 为 支持 问 量 ， 如 图 16.5 所 示 。 





v к. 


ÆA (16-14) 中 ， 所 有 ai = 0 的 样本 去 对 于 求 和 没有 影响 ， 只 有 文 
БЕ] а: Со; 的 样本 云 ) 对 最 优 分 割 超 平面 的 定义 有 贡献， 因此， 完整 
的 样本 集合 可 以 只 使 用 文 持 问 量 来 代 蔡 ， 将 会 得 到 相同 的 最 优 分 割 超 
Де» 


求 出 上 述 各 个 系数 。 G. 对 应 的 最 优 解 。 、 
i 、b 后 ， 得 到 如 下 的 最 优 分 类 函数 : 


П 
М) = (аа) + b*) = (у, агу Z) + 6) 


i=l 


(16-17) 


其 中 ， 回 量 z 是 待 分 类 的 测试 样本 ， 同 量 去 《ii 
=1,2,...,N ) 是 全 部 N 个 训练 样本 。 


注音 在 式 (16-17) 中 测试 样本 s 与 训练 样本 
也 是 以 反 积 的 形式 出 现 。 


16.2.2 ” 非 线 性 可 分 情况 下 的 C-SVM 
1. 约束 条 件 


为 处 理 样 本 非 线 性 可 分 的 情 帝 ， 可 以 放宽 约 
束 ， 引 入 松弛 变量 e; >0， 此 时 约束 条 件 变 为 : 


ТАКТ а БаР >() (1=1,2,. А N ) 


(16-18) 


[W.X. +b +l- у= + 1E 81) 
[w.x+b<-1+8,, у=+(Х% F fl) 


图 16.6 可 帮助 读者 理解 gs 的 意义 ， 有 具体 可 分 为 
以 下 3 种 情况 来 考虑 。 


(1) 当 g =0， 约 束 条 件 退 化 为 线性 可 分 时 的 
情况 一 一 y; (27+ )>1， 这 对 应 于 分 类 间隔 R 
地 ) 以 外 且 被 正确 分 美的 那些 样本 ， 即 图 中 左 侧 虚 
线 以 左 〈 包 括 在 无 侧 虚 线 上 ) ВАТ“. ” 形 样 本 点 
以 及 位 于 右 侧 虚线 以 右 的 〈 包 括 在 右 侧 虚线 上 ) 的 
所 有 “x” 形 样本 点。 


(2) 当 0<e; <1 时 ，y; (eza ) 是 一 个 0、1 之 间 
的 数 ， 小 于 1 意味 看 对 于 约束 条 件 放 千 到 允许 样本 
洛 在 分 类 间 隅 之 内 ， 大 于 0 则 说 明 样 本 仍 可 被 分 割 
超 平 面 正确 分 类 ， 对 应 于 图 中 标 写 为 2 的 样本 。 


(3) w e; >1 时 ， Yi (= i+ b )<0, 此 时 约束 
条 件 已 放宽 到 可 以 允许 有 分 闫 错误 的 样本 ， 如 图 
16.6 所 示 的 第 3 奖 样 本 。 有 只 体 地 说 ， 图 中 标号 为 3 的 ” 
。” 形 样本 的 1<e; <2， 而 标 写 为 3 的 “x” 形 样本 的 gi 
>2. 


图 16.6 中 标号 为 1、2、3 的 均 为 在 线性 不 可 分 情 
况 下 的 文 持 同 量 。 由 于 在 这 种 情况 下 允许 样本 洲 入 
分 闫 间 隅 之 内 ， 第 把 这 个 分 类 间 隅 叫做 软 间 陋 
(Soft Margin) 。 





ё ® 
图 16.6” 非 线性 可 分 情况 下 的 最 住 分 割 超 平面 


注 ， 标 号 1， 分 类 间隔 支持 向 量 ， 对 应 si =0; 
标号 2， 非 分 类 间隔 支持 向 量 〔 分 类 间隔 中 ) ， 对 
应 0<gi <1， 标 号 3， 非 分 类 隔 支持 向 量 si >1. 


2. 目标 函数 


利用 一 个 附加 错误 代价 系数 C н, Нахр AAE 


flw,b,e) = чүш? 4 cy =; 
u 1—1 
(16-19) 


目标 是 在 式 (16-18) 的 约束 下 ， 最 小 化 目标 
ра (2016-19) 。 最 小 化 目标 函数 的 第 1 项 也 就 等 
司 于 最 大 化 分 类 间隔 ， 这 在 介绍 线性 可 分 情况 时 已 
经 并 述 过 了 了， 而 目标 水 数 的 第 2 项 是 分 类 造成 的 错 
误 代 价 ， 只 有 对 应 于 g; >0 的 那些 “错误 ”样本 才 会 产 
生 代 价 《〈 这 里 所 说 的 “错误 ”并 不 仅仅 指 被 错误 分 类 
的 标号 为 3 的 样本 ， 也 包括 那些 空白 间隔 之 内 的 标 
号 为 2 的 样本 ) 。 事 实 上 最 小 化 此 目标 函数 体现 了 
最 大 分 类 间隔 (最 小 化 式 (16-19) 中 的 第 1 项 ) 与 
最 小 化 训练 错误 (最 小 化 式 (16-19) 中 的 第 2 项 ) 
之 则 的 权衡 。 


ААЖ Ей АХ ВУКА И, AA 
MARBRE REKER ЖИЕ K 
МКР УК, КИТЕ пу ВЕ SPY 1—1 
地 的 超 平 面 ， 这 无 疑 会 影响 分 基 大 的 推广 能 力 ， 在 
对 测 弃 样 本 分 类 时 融 很 难得 到 请 意 的 结 未 ， 这 也 属 


于 一 种 过 度 拟 合 。 通 过 调整 代价 系数 C 的 值 可 以 实 
现 两 痢 之 则 的 权衡 ， 找 到 一 个 最 佳 的 C 使 得 分 类 超 
Ра Я ИН ЕЈ ВЕ 


МАЈАЧСЛАХТ Т2 УЫ ИП 16.72. B 
16.7 (а) 中 的 情况 对 应 一 个 相对 较 大 的 C IB, Н 
每 错 分 一 个 样本 i (g,>0) 都 会 使 式 (16-19) 中 的 
第 2 项 增 大 很 多 ， 第 2 项 成 为 影响 式 (16-19) 的 主 
要 因素 ， 因 此 最 小 化 式 〈16-19) 的 结果 是 尽 可 能 
少 地 错 分 训练 样本 以 使 得 第 2 项 尽 可 能 小 ， 为 此 可 
以 适当 牺牲 第 1 项 〈 使 第 1 项 大 一 些 ， 即 使 分 类 间隔 
小 一 些 ) ， 于 是 导致 了 图 16.7 (а) 中 一 个 较 小 间隔 
但 没有 和 钳 分 训练 样本 的 分 类 超 平 徊 ;多 16.7 (b) K 
展示 了 将 图 16.7 (а) 中 得 到 的 分 类 超 平面 应 用 于 测 
试 样本 的 效果 ， 可 以 看 出 由 于 分 割 超 平面 间隔 较 
小 ， 分 类 妖 的 推广 能 力 不 强 ， 对 于 测试 样本 的 分 类 
不 够 理想 。 





(a) C 的 取 值 过 大 导致 过 度 拟 合 训练 样本 的 小 余地 分 类 超 平面 (b) 将 图 Ca) 中 过 度 拟 合 的 分 类 器 应 用 于 测试 样本 





(c) 取 值 合适 的 C: 人 允许 适当 地 错 分 训练 样本 从 而 得 到 (d) 将 图 (c) 的 较 大 余地 分 类 器 应 用 于 测试 样本 
较 大 余地 的 分 类 超 平面 


图 16.7” 惩 如 项 参数 C 的 不 同 取 值 对 于 分 类 卓 性 能 的 影响 


如 果 在 训练 过 程 中 选择 一 个 适当 小 一 些 的 C 
值 ， 此 时 最 小 化 式 (16-19) 将 兼顾 训练 错误 与 分 
类 则 隅 。 如 图 16.7 (c) 所 示 ， 里 然 有 一 个 训练 样本 
饿 错 分 ， 但 得 到 了 一 个 较 大 分 类 间隔 的 超 平 甸 ， 图 
16.7 (d) 展示 了 将 图 16.7 (с) 中 得 到 的 分 类 超 平 
面 应 用 于 测试 数据 时 的 情形 ， 可 以 看 到 由 于 分 类 间 
也 较 大 ， 分 类 器 具有 民 好 的 推广 能 力 ， 从 而 很 好 地 
分 类 了 测试 样本 。 


由 此 读者 看 到 了 选择 合适 的 错误 代价 系数 C 的 
重要 性 ， 在 16.4.3 小 万 天 于 SVM 综合 采 例 的 讨论 中 
将 提供 一 种 切实 可 行 的 方法 来 选择 C 的 取 值 。 而 正 
因为 在 这 种 处 理 非 线性 可 分 问题 的 方法 中 引入 了 错 


误 代 价 系数 C ， 这 种 支持 问 量 机 向 个 称 为 C-SVM。 
3. 优化 求解 


类 似 于 线性 可 分 情况 下 的 推导 ， 最 终 得 到 下 面 
的 对 偶 问 题 。 


Е али 0а 1,9-0 
Р (a ): 


ОУ сщ Ty) 
=] i=l 7—1 


(16-21) 
同样 在 利用 二 次 规划 技术 解 得 最 优 的 。 的 值 。 
之 后 ， 可 以 计算 出 w 和 b 的 值 ， 最 终 的 决策 函数 与 
式 (16-17) 相同 。 
16.2.3 ”需要 核 国 数 映射 情况 下 的 SVM 
线性 分 类 需 的 分 类 性 能 毕 葛 有 限 ， 而 对 于 非 线 


性 问题 一 味 放 览 约束 条 件 只 能 导致 大 星 样 本 的 销 
分 ， 这 时 可 以 通过 非 线 性 变换 将 其 转化 为 条 个 噩 维 
宇 间 中 的 线性 问题 ， 在 变换 空间 求 得 最 住 分 类 超 平 
面 。 


1. ЧЕ {ЖШ 


如 图 16.8 所 示 ， 图 16.8 (а) 中 给 出 了 是 在 n 4 
空间 中 非 线 性 可 分 的 两 类 样本 (限于 图 的 表现 能 
力 ， 只 画 出 了 二 维 ) ， 通 过 一 个 非 线性 映射 w : R" 
-RD 将 样本 映射 到 更 高 维 的 特征 空间 RD (限于 图 
的 表现 能 力 ， 只 画 出 了 二 维 ) ， 上 映射 后 样本 vy (z, ) 
(i=1,2,....N ) 在 新 的 特征 空间 RO 中 线性 可 分 ， 经 
训练 可 得 到 一 个 图 16.8 (b) 中 所 示 的 D 维 的 分 割 超 
和 平面。 而 再 将 此 D 维 分 割 超 平 面 映 射 回 名 ， 访 超 于 
ША ВЕЛЛ T En 维 中 的 一 条 能 够 完全 分 开 两 次 
样本 的 超 抛物 面 ， 如 图 16.8(c) 所 示 。 





图 16.8 “使 用 非 线 性 映射 由 将 已 知 样本 映射 到 (高 维 ) 特 征 空 


РР 


图 16.8 所 展示 的 只 是 一 种 比较 理想 的 情况 ， 实 
际 中 样本 可 能 在 映射 到 高 维 空间 RP 后 仍 非 线性 可 
分 ， 这 时 只 需 在 R02 中 采用 16.2.2 小 节 介 绍 的 非 线 性 
可 分 情况 下 的 方法 训练 SVM。 还 有 一 点 要 说 明 的 是 
在 分 类 时 ， 永 远 不 需要 将 R 中 的 分 割 超 平面 再 映 
WER 当中 ， 而 是 应 让 分 类 样本 :也 经 非 线 性 变换 
映射 到 空间 RD 中 ， 然 后 将 yw (E EARP 中 的 SVM 
分 类 器 即 可 。 


2. 优化 求解 


类 似 于 16.2.1 小 节 中 的 推导 ， 最 终 得 到 了 下 面 
的 对 偶 问题 。 


在 如 下 的 约束 条 件 下 : 
У: о = 0, 0< <C.i=1,.2,.... . N 
(16-22) 


最 大 化 目标 函数 : 


(16-23) 


此 时 ， 因 为 有 2 8 
故 最 终 的 决策 〈 分 类 ) 函数 为 : 


N 


hT) = sen(ul- biT) +b) = sgnl 5 oi( pT) p(T) +b), ab € RU b € R 
i=l 


(16-24) 


同样 ， 由 于 对 非 支持 向 量 而 言 其 = 0， 所 以 上 
式 可 以 写成 : 
h(z) = sgn( у, аву ( (1) :YD)) + b°) 


ES 


(16-25) 


其 中 ，SV 表 示 文 持 同 量 (Support Vector) 的 
集合 。 





УЕ М, 
式 (16-23) . 


т (16-24) 在 形式 上 同 式 (16-21) ~ = (16-17) 
ЧЕ ЛИНИ, R EK АЕ ЕН) ЕН AS e E AR у рај ЕЕ 


JTT [Н] ЕР 中 的 映像 之 间 的 / H. 
MARKAMA АЕ ТЕНЕУ И K FZ E uj 


分 问题 变 为 映射 空间 中 线性 可 分 问题 的 实例 。 
【 例 16.1】 有 寞 或 问题 的 SVM 


措 或 (XOR) 问题 是 最 徐 单 的 一 个 无 法 百 接 对 
样本 特征 同 量 采用 线性 判别 图 数 来 解决 的 问题 ， 在 
z =(1,1) 的 点 1 和 在 z =(-1,-1)! 的 点 3 属于 类 w 1 (图 
16.9 中 的 实心 圆 点 ) ， 在 z =(1-1 的 点 2 和 在 z =(-1, 
1)! 的 点 4 属于 w ，( 空 心 圆 点 ) 。 





(a) 腊 或 问题 (b) 映射 到 6 维 空间 后 的 2 维 投 影 


图 16.9” 腊 或 问题 的 非 线 性 映射 


这 样 在 二 维 空间 R 中 ， 无 法 找到 一 条 直线 
СВ 中 的 线性 分 类 器 ) 可 以 将 两 类 样本 完全 分 开 。 
通过 使 用 SVM 的 方法 ， 利 用 非 线 性 映射 y 将 这 4 个 
特征 向 量 映 射 到 更 高 维 的 空间 Ro 可 以 解决 异 或 问 
题 ， 在 R 中 这 4 个 特征 向 量 是 线性 可 分 的 。 存 在 很 
多 这 样 的 由 函数 ， 这 里 选用 一 个 最 简单 的 且 展 开 不 
超过 2 次 的 届 : 


一 i y P -而 Ë ѓе fa /ny 2 23 
т = (T| pal pu == мулт, уау Ера ота s 


其 中 ，xi АЕ Не 在 第 i 维 上 的 分 量 ，vi ЛЕ 
Ау. 


ЛЕЗА Я, 原 二 维 空间 中 的 4 个 点 被 分 别 映 
射 至 6 维 空间 : 


Р . 型 = s: ПЕ" 

fg Wh 11.2 2 А? 1. Т\ 
m= у уо 5 зл] 
Е е И уа уат 


ma 1 е = fi. ао уо рот 


416.9 (b) 101272 В 21642 [u] Ja 
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是 样 本 在 第 2 和 第 4 维度 上 的 二 维 投影 。 很 明显 在 这 
AR 空间 中 可 以 找到 最 佳 分 割 超 平 面 g (x 1,x 2 )= х 
2 =0， 且 衬 日 间 阳 为 vz ， 诅 超 平 面 对 应 于 原始 特征 
空间 的 双 曲 线 x1 x 2 =+1. 


下 和 面 给 出 求解 的 过 程 。 
根据 式 (16-22) ， 约 束 条 件 为 : 


N 
> ayi = Ü >o, — оз Боз — оц = 0, 0 < ар, (k = 1,2,3, 4) 
=] 


由 于 线性 可 分 这 里 可 不 考虑 代价 系数 C 。 在 此 
约束 条 件 下 ， 最 大 化 式 (16-23) , Bp: 


1 


Lial = у б; 一 
i=l 


PS 


1 1 
3 Э пут то 
1=1 


1 一 ] 


显然 ， 由 于 这 个 问题 的 对 称 性 ， 可 取 。1 =з. 
=。4 。 而 且 对 于 这 个 简单 的 问题 ， 不 必 采 用 标准 的 
一 次 规划 技术 ， 而 是 可 以 直接 用 解析 的 方法 求解 ， 
将 训练 样本 的 特征 向 量 : 和 对 应 的 类 标签 y 代入 上 
Š, WR: ws=18s=1234， 从 而 可 知 这 4 个 训练 样 
本 都 是 支持 向 量 。 


Ууз к. 
注意 


大 多 数 SVM 解 决 的 问题 支持 向 量 总 是 远 远 少 于 样本 总 数 ， 但 由 于 
例 16.1 中 的 异 或 〈XOR) 问题 具有 高 上 度 的 对 称 性 ，4 个 训练 样本 均 为 文 


持 向 量 。 
З. РАХ 


例 16.1 成 功 地 利用 了 非 线 性 映射 解决 了 在 原 
二 维 空间 中 非 线 性 可 分 的 异 或 问题 ， 然 而 这 只 是 一 
个 简单 的 例子 ， 计 算 所 有 样本 的 非 线 性 映射 并 在 高 
维 空间 中 计算 其 点 积 帝 稼 是 困难 的 。 竺 和 运 地 是 ， 在 
一 般 情 况 下 都 不 必 如 此 ， 甚 至 不 需要 去 关心 映 射 由 
的 具体 形式 。 注 意 到 在 上 面 的 对 偶 问 题 中 ， 不 论 是 
2 (16-23) 的 寻 优 目标 函数 式 还 是 式 〈《16-24) 的 
决策 〈 分 类 ) 函数 都 只 涉及 样本 特征 问 量 之 间 的 点 
积 运 算 y (ху) y (ху) 。 因 此 , 在 高 维 空间 实际 
上 只 需 进 行 点 积 运 算 , 而 再 高 维 数 的 同 量 的 点 积 疆 
Жн АУ, НА ВЕИТ ШУНА Я Ју (x; ) 和 vw 
(x; ) НАЈ А х Mx 在 原 特 征 空间 


中 得 到 Wy (xi; ) зу (x; ) WENER? ЕН 
定 的 ， 因 为 这 种 点 积 运算 是 可 以 用 诛 特 征 空 间 中 的 
核 图 数 (Kernel) 实现 的 。 


根据 沁 函 的 有 天 理论 ， 只 要 一 种 核 困 数 天 (xi , 
Xj ) 满 足 Mercer 和 条件 ， 它 就 对 应 某 一 变换 空间 (RD 
i ЖАЛА, KAPIRIT РАУ ЛАРА ЖҮН) 


核 水 数 是 一 个 对 称 函数 K : А" хр" >R, ЕЖ 
两 个 R? 空间 中 的 n 维 辐 量 映 射 为 一 个 实数 。Mercer 
核 国 数 计算 高 维 至 加 中 的 点 积 : 

K (zi Tj) = Plt) Plr) ， 其 中 ппу RP 
(16-26) 

这 样 如 果 能 够 在 特征 空间 中 发 现 计 算 点 积 的 
Mercer% Р 5, ГЕИ H 1272 K ИК ЗС E 
机 中 的 点 积 运算 ， 而 根本 不 用 去 关心 非 线 性 映射 由 
的 具体 形式 ， 因 为 在 SVM 训练 和 分 类 中 的 所 有 相关 
公式 中 ， 由 都 没有 单独 出 现 过 ， 总 是 以 (x; ) :vw 


因此 采用 适当 的 内 积 核 函数 K (xi , x; ) 就 可 以 实 


WAR [H] [я] 2 22 18) ШШЕ], JAI SE Е 
RETRETAR а JZ Е, m ЛЕ АП ЛЕВ H 
加 。 些 时 式 (16-23〉 的 优化 目标 函数 变 为 : 


N 


| N N 
Liaj = b N Qi — 5 > Ў, озо угуу K (Ti, Lj ) 


(16-27) 
MIA (16-24) ВЈ (TXR) РА НАХ: 


hiz) = sgnl 5 ок yK (Ti T) + b°) 
тет, 


(16-28) 
НАЛАР ОН РА РЛ. 
(1) 线性 核 函数 : Kesey 

(16-29) 
(2) 多 项 式 核 国 数 :， к.) = (0+1). d=12.,N 

(16-30) 


(3) 1 [п] Ж PKI ЖҮ: K(z,y) = екхр(—=||ж— yll’) 


(16-31) 


(4) Sigmoid 核 РЁ ЭМ: K(x, y) = tanh (b{x y) — с) 
(16-32) 


16.4.4 TRAX LFR У WJ ВА 72 А 
A РД K Hu 328 H РЕ [a] i JZ РА REITIT 
ZH, у ШШ) ЙЕ n] 28428 Ж ТЕ H ET yE ll 
的 阐述 。 
16.2.4 推广 到 多 类 问题 

在 之 前 的 问题 摘 述 中 读者 可 能 也 已 经 注意 到 ， 
SVM 是 一 个 二 分 器 ， 只 能 用 于 两 类 样本 的 分 类 。 当 
然 如 末 仅 仅 如 此 ，SVM 是 不 可 能 得 到 如 此 广泛 的 应 
用 的 。 下 面 惑 来 研究 如 何 将 二 分 SVM 进行 推广 ， 使 
其 能 够 处 理 多 类 问题 。 


有 3 种 常用 的 案 略 可 用 于 推广 SYM 解决 多 类 问 
题 ， 下 面 以 一 个 4 闫 问题 为 例 进 行 说 明 。 


1. 一 对 多 的 最 大 啊 应 策略 (one against all) 


假设 有 A В, С, р 四 类 样本 需要 划分 。 在 
抽取 训练 集 的 时 候 ， 分 别 按照 如 下 4 种 方式 划分 。 


(1) А 所 对 应 的 样本 特征 问 量 作为 正 集 (类 


М 0+1), В, C. D 所 对 应 的 样本 特征 癌 量 作 
为 负 集 (类 标签 为 -1) 。 


(2) B 所 对 应 的 样本 特征 同 量 作为 上 正 集 ，A 
‚ С, D 所 对 应 的 样本 特征 问 量 作为 负 集 。 


(3) C 所 对 应 的 样本 特征 癌 量 作为 正 集 ，A 
`В. D 所 对 应 的 样本 特征 问 量 作为 负 集 。 


(4) D 所 对 应 的 样本 特征 同 量 作为 正 集 ，A 
. B. C 所 对 应 的 样本 特征 同 量 作为 负 集 。 


对 上 述 4 个 训练 集 分 别 进行 训练 ， 得 到 4 个 SVM 
分 类 器 。 在 测试 的 时 候 ， 把 未 知 类 别 的 测试 样本 ; 

分 别 送 入 这 4 个 分 类 器 进行 判决 ， 最 后 每 个 分 类 器 

都 有 1 个 响应 ， 分 别 为 f1 (=) Ро (е) Ёз (=) Ёа ( 
)， 最 终 的 决策 结果 为 max(f | (= ),f 2 Ef (Ра G 

))， 即 4 个 响应 中 的 最 大 者 。 


注意 这 里 所 说 的 啊 应 是 指 决 策 函 数 
h(z) = эвт(а Yl) +b) ТЕТ Sr IK, BU HU 38] (о) = (е) +», h 
(ERR: 位于 分 割 超 平 面 的 哪 一 出， 只 反映 了 = 的 
RA) Mf (= ) 还 能 体现 出 z 与 分 割 超 平 面 的 距离 远 
这 《绝对 值 越 大 越 远 ) ， 因 此 它 能 够 反映 出 样本 z 
属于 茶 一 类 列 的 置信 度 。 例 如 ， 同 样 位 于 分 割 超 平 
面 正 侧 的 两 个 样本 ， 有 法 然 更 加 远离 超 平面 的 样本 起 


ШЕЙН Н {а 23 Ka m RE E ИУ А ДИВ 
п] ЕЛЕУЛ ЭУ ans ШУ 4 ЇЙЇ 


2. 一 对 一 的 投票 条 上 略 (one against one with 
voting ) 


ЖА, B. C. D 四 类 样本 两 类 两 类 地 组 成 训 
2%, ВКА В). (А,С). (А,р). (В,С). (B,D 
)、(C,D )， 得 到 6 个 (对 于 n 类 问题 ， 为 n (п –1)/2 
М) SVM 二 分 划 。 在 测试 的 时 候 ， 把 测试 样本 : (K 
人 钦 计 入 这 6 个 二 分 类 疾 ， 及 取 投 票 形式 ， 最 后 得 到 
一 组 结 来 。 投 票 是 以 如 下 方式 进行 的 。 


ЈАВИ: vote(A )= vote(B )= vote(C )= vote(D 
)=0. 


投票 过 程 : 如 果 使 用 训练 集 (A ,B ) 得 到 的 分 类 
ЖЛ z 判定 为 A 类 , 则 vote(A )=vote(A )+1, 7701!) 
vote(B )=vote(B )+1; 如 朵 使 用 (A ,С )UllZkHJ 27 2ŠS 48 
将 z 判定 为 A 类 , 则 vote(A )=vote(A )+1, @%Jl|jvote(C 
)=vote(C )+1; ...... 如 条 使 用 (C ,D УЧ 
判定 为 C 类 , 则 vote(C )=vote(C )+1， 人 否则 vote(CD 
)=vote(D )+1. 


最 终 判 决 : Max(vote(A ), vote(B ), vote(C ), 
vote(D ))。 如 有 两 个 以 上 的 最 大 信 ， 则 一 般 可 人 简单 


地 取 第 一 个 最 大 全 所 对 应 的 突 别 。 


3. 一 对 一 的 淘汰 策略 (one against one with 
eliminating ) 


这 是 在 文献 [10] 中 专门 针对 SVM 提 出 的 一 种 多 
类 推广 策略 ， 实 际 上 它 也 适用 所 有 可 以 提供 分 类 器 
置信 和 度 信 息 的 二 分 右 。 访 方法 同样 基于 1 对 1 判别 策 
略 解决 多 闫 问题 ， 对 于 本 贡 的 4 英 问 题 ， 需 训练 6 个 
分 类 器 : (А,В). (А,С). (A ,D). (В,С). (B,D 
)、(C ,D )。 


显然 ， 对 于 这 4 类 中 的 任意 一 类 ， 如 第 A 类 中 
的 某 一 样本 ， 就 可 由 (A ,В). (A ,C). (A ,D ) 这 3 个 
二 分 需 中 的 任意 一 个 来 识别 ， 即 判别 函数 间 存 在 元 
余 。 于 是 将 这 些 二 分 大 根 据 其 置信 虚 从 六 到 小 排 
序 ， 置 信和 度 越 大 表示 此 二 分 器 分 类 的 结果 越 可 靠 ， 
反之 则 越 有 可 能 出 现 误 关 。 对 这 6 个 分 类 器 按 其 置 
信和 及 由 大 到 小 排序 并 分 别 编 号 ， 假 设 为 1# (A ,C )， 
2# (А,В), 3#(A,D), 4#(B,D), 5#(C,D), 6# (B 
,C )。 


此 时 ， 判 列 过 程 如 下 : 


(1) 设 被 识别 对 象 为 x ， 首 先 由 1# 判别 函数 
进行 识别 。 若 判别 函数 h (x ) = +1， 则 结果 为 类 型 A 


， 所 有 有 天 于 类 型 C WAI РЁ К: Яз ЭЖ 
Ih (х) =-1， 则 结果 为 闫 型 C， 所 有 天 于 类 型 A 的 
FP RROJ; 911 РА 25А (х) = 0， 为 “拒绝 
决 案 ” 的 情形 ， 则 和 朋 接 选用 2# 判 列 函数 进行 识 列 。 
假设 结果 为 类 型 C ， 则 所 剩 判 列国 数 为 4#(B ,р ) 
,5# (С ,D ) 和 6# (В,С). 


(2) 19) х 再 由 特 判别 函数 进行 识 
列 。 知 结果 为 类 型 +1， 淘 汰 所 有 关于 D 类 的 判别 函 
数 ， 则 所 剩 判 列 图 数 为 6# (В,С )。 


(3) ЖН х H BGH 判别 函数 进行 识 
别 。 若 得 到 结果 为 类 型 +1， 则 可 判定 最 终 的 分 类 结 
RIB 。 


№2, ШЇ Жл АЛЕН? 对 于 SVM 而 言 ， 
分 割 超 平 面 的 分 闫 间隔 越 六 ， 束 说 明 两 基 样 本 越 容 
易 分 开 ， 表 明了 问题 本 号 较 好 的 可 分 性 。 因 此 可 以 
НЛ БУМ TRT RH ХАМЕ АИА. 


在 上 述 的 一 对 一 的 淘汰 策略 中 ， 每 经 一 个 判别 
函数 束 有 某 一 类 列 补 排除， 与 该 类 列 有 关 的 判别 函 
数 也 被 淘汰 。 因 此 ， 一 般 经 过 c- 1 次 判别 束 能 得 到 
R. Am. AFAI KRAE ARARA H pea 
到 “拒绝 决策 ”的 情形 Ch(x)=0) ， 此 时 ， 若 直接 
Sh (x ) 为 +1 或 -1， 而 把 它 归 于 某 一 类 ， 束 可 能 导致 


误差 。 所 以 不 妨 利用 判别 函数 之 间 所 存在 的 元 余 进 
行 再 决策 ， 以 减少 这 种 因 * 拒 绝 决策 "而 导致 的 误 
判 ， 一 般 再 经 过 1 或 2 次 决策 即 可 得 到 最 终结 果 。 


以 上 3 种 多 类 问题 的 推广 案 略 在 实际 应 用 中 一 
般 痢 能 取得 满意 的 效 末 ， 相 比 之 下 第 2 种 和 第 3 种 在 
很 多 情况 下 能 取得 更 好 的 效 末 ， 在 16.4 季 基于 
MATLAB 的 人 上 脸 识 别 系 统 中 ， 将 使 用 第 2 种 一 对 一 
的 投票 朱 略 解雇 多 类 问题 。 


由 两 类 癌 多 类 的 推广 不 仅仅 是 在 SVM 中 才 会 遇 到 的 问题 。 在 模式 
识别 和 机 需 学 习 领 域 还 有 很 多 天 然 的 二 分 右 ， 如 线性 感知 霹 ， 
Adaboost 等 。 一 般 来 说 ， 上 面 讨 论 的 3 种 推广 有 策略 对 于 这 些 二 分 需 同 样 
适用 。 


163 SVM 的 MATLAB 实 现 


MATLAB 从 7.0 版 本 开始 提供 对 SVM 的 文 持 ， 
其 SVM 工 具 箱 主要 通过 svmtrain() 和 svmclassify() 两 
个 函数 封 攻 了 SVM 训练 和 分 类 的 相关 功能 。 这 两 个 
图 数 十 分 徐 单 多 用 ， 即 使 对 于 SVM 的 工作 原理 不 是 
很 了 解 的 人 也 可 以 轻松 学 握 。 本 节 将 介绍 SVM 工具 
箱 的 用 法 并 给 出 一 个 应 用 实例 。 


16.3.1 11125 ——ѕутгаіп 


国 数 sSvmtrain0 用 来 训练 一 个 SVM 分 类 闫 ， 锦 
用 的 调用 语法 如 下 。 


SVMStruct = svmtrain(Training, Group) 


参数 说 明 : 


。Training 古 一 个 包含 训练 数据 的 m 行 n АЈ 
БЕ, Вул ЛЖ Ж О Шш), т: 
示 训 练 样本 数目 ; n 表示 样本 的 维 数 ; 

Group 是 一 个 代表 训练 样本 类 标 丛 的 1 维 同 量 ， 
其 元 素 值 只 能 为 0 或 1， 通 常 1 表 示 正 例 ，0 表 示 
反例 ，Group 的 维 数 必须 和 Training 的 行 数 相 

以 你 证 训练 样本 同 其 类 别 标号 有 的 一 一 对 
Wo 


返回 值 : 


SVMStruct 是 训练 所 得 的 代表 SVM 分 类 姨 鸭 结 
构 体 ， 包 含有 天 了 最 佳 分 割 超 平 面 的 种 种 信息 ， 如 。 
a Mib; 此外， 该 结构 体 的 SupportVector 域 中 
还 包 人 台 了 文 持 回 量 的 详细 信息 ， 可 以 使 用 
SVMStruct.SupportVector 狱 得 它们 。 而 这 些 都 是 后 
续 分 类 所 需要 的 ， 如 在 基于 1 对 1 的 淘汰 脓 略 的 多 关 
RREA ГЕ ИЕЛЕ, ПАЈА, ОЈ 
通过 。 Т Н КИН, Л Т РТ ЈА Н 


г} 


А] В КАЈ" = тт 。 

除 上 述 的 各 用 调用 形式 外 ， 还 可 通过 <' 属 性 名 '， 
属性 值 > 形 陈 的 可 选 参数 设置 一 些 训练 相关 的 高 级 
选项 ， 从 而 实现 菏 些 日 定义 功能 ， 谨 明 如 下 。 

1. ИЕМ 


Ѕутпігаіп() pR 2 70 FJ FEIER Е В НУ pR A 
的 种 类 或 指定 目 己 编写 的 核 函数 ， 方 式 如 下 。 


SVMStruct = svmtrain(..., 'Kernel Function', Kernel Fun 


ctionValue); 





其 中 ， 参 数 Kernel FunctionValue 的 第 用 合法 取 
值 如 表 16.1 所 示 。 


表 16.1 参数 Kernel FunctionValue 的 合法 取 值 


合法 取 值 


线性 核 函 数 〈 上 默认 选项 ) 


多 项 式 核 函 数 〈 默 认 阶 数 d =3, d 的 意义 参见 式 (6-30) ) 


[я] 71% РА Ж 


Function handle 以 符号 “@” 开 头 的 自己 编写 的 核 函 数 的 句柄 








例如 读者 希望 采用 径 回 基 核 函数 训练 SVM， 可 
以 按照 如 下 方式 调用 。 


SVMStruct = svmtrain (Training, Group, 'Кегпе1 Function 
', 'nbf О; 





ШЭ, АЈ Е FFE РА ОЛН ЖШ Ж. 
如 下 面 的 调用 表示 人 选用 4 阶 〈d = 4) Ну Ж КРА 
СЗХ И: IPE, VUIZKSVM. 


SVMStruct = svmtrain(Training, Group, “Kernel Function? 


, ‘polynomial’, 'Polyorder', 4); 





Еи А КОРА > PAZ Ej ú H] ВУЛ РЁ ЭТ TE 
持 一 致 。 

НЕ УРА НУН РУ К. 
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辣 中 的 点 积 ， 此 时 可 以 将 参数 Kernel FunctionValue 
设置 为 目 己 编号 的 核 图 数 kfun 的 句柄 ， 以 @kfun 的 
ДЕ МТ 


JERY JZ РА ЖЕ ХП F ç 


iss K = kfun(X, Y) 


ЯН, X, Үт 行 和 n Н EERE, 
它们 拥有 相同 的 列 数 | ， 即 目 定 义 核 图 数 需要 计算 X 
中 的 m 个 1 维 回 量 与 了 中 的 mn 个 1 [я] #ҥ 58] р 2 [н] ВЈ 
РА ИА, лт xn 个 实数 值 结果 ， 放 在 m xn 的 
ЖЕК 中 返回 。 


K(i j ) 就 表示 向 量 X (i,: ) 与 向 量 Y G, 
: ) 在 高 维 映射 空间 中 的 点 积 。 


如 果 要 同 目 定义 核 函 数 中 传 圳 参数 ， 则 核 水 数 
应 定义 如 下 。 


function K = kfun(X, Y, P1, P2) 


HEHH, X. ҮЖХ КЕ, WP 1. P 2 为 核 函 数 
的 参数 ， 在 调用 时 以 @(X ,Ү) kfun(X ,Y ,P 1,P 2) 的 
VA 


例如 ， 要 自 定 义 一 个 式 (16-32) 中 的 Sigmoid 
FZ PK к(а. и) = tanh {ble -y)— с), HELA 
kfun_sigmoid.m £F, ЖЕНЕ X $Z A 2ykfun_siemoid 
ШК. 


function K = kfun_sigmoid(X, Y, b, c) 
% sigmoid 核 函数 ，b，c 为 其 参数 


K = tanh(b*(X*Y" )-c); 





调用 时 格式 如 下 。 


SVMStruct= svmtrain( Training, Group, 'Кегпе1 Function' 
› @(X,Y) kfun sigmoid(X,Y,1,60) ); 





2. 训练 结果 的 可 视 化 


当 训 | 练 数据 是 二 维 时 可 利用 'ShowPlot' 选 项 来 获 
得 训练 结果 的 可 视 化 解释 ， 调 用 形式 如 下 。 


svmtrain(..., 'ShowPlot', ShowPlotValue); 


ЖЕ, H 7797 8 ShowPlotValue HE ZJ1(true)Ë|! 
HJ. 


3. 设 定 错误 代价 C 


在 16.2.2 小 节 讨 论 非 线 性 可 分 情况 下 的 C-SVM 
时 ， 人 介绍 了 错误 代价 系数 C 对 于 训练 和 分 类 结果 的 
影响 ， 下 面 将 给 出 设 定 C 值 的 方法 。 由 式 (16-21) 
可 知 ， 引 入 C 对 于 二 次 规划 问题 求解 的 影 啊 仅仅 体 


现在 约束 条 件 当 中 ， 因 此 通过 在 调用 svmtrain0 时 设 
置 一 个 优化 选项 “boxconstraint*” 即 可 ， 调 用 形式 如 
下 。 


SVMStruct = svmtrain(...,'boxconstraint',C); 





其 中 ，C 即 为 错误 代价 系数 ， 献 认 取 值 为 Inf， 
表示 铬 分 的 代价 无 限 关 ， 分 割 超 平 面 将 倾 同 于 尽 可 
能 取 小 化 训练 错误 。 


通过 适当 地 设置 一 个 有 限 的 C 值 ， 将 得 到 一 个 
如 网 16.7(@O 所 示 的 软 超 平 面 。 


16.3.2 2725 ——ѕутсаѕѕіѓғу 


РЁ žtsvmclassify 0#] H 112519 AI SVMStructZ5 
构 对 一 组 标本 进行 分 类 ， 当 用 调用 形式 如 下 。 


Group = svmclassify(SVMStruct, Sample); 


参数 说 明 : 


° SVMStruct 是 训练 得 到 的 代表 SVM 分 类 硕 的 结构 
№, H K {5ѕутігаіп() 2 |91; 
° Sample 征 要 进行 分 类 的 样本 窍 阵 ， 每 行为 1 个 样 


本 特征 同 量 ， 总 行 数 等 于 样本 数目 ， 总 列 数 是 
样本 特征 的 维 数 ， 它 必须 和 训练 该 SVM 时 使 用 
的 样本 特征 维 数 相同 。 


人 返回 值 : 


° Group 古 一 个 包谷 Sample 中 所 有 样本 分 类 结果 有 的 
aE, HER Samplet BE HIIT ŽE TE 


=) КЕЗ ShowPlot” 选 项 来 
获得 分 类 结果 的 可 视 化 解释 ， 调 用 形式 如 下 。 


svmclassify(..., 'Showplot', ShowplotValue) 


16.3.3 ”应 用 实例 


下 面 的 MATLAB 实 例 使 用 svmtrain() 和 
svmclassify() 闵 数 解 决 了 一 个 二 维 空间 中 的 两 类 问 


W, 
[1116.2] 二 维 SVM 的 可 祝 化 解释 。 


本 例 使 用 MATLAB 目 市 的 蕊 尾 属 植物 数据 集 来 
将 刚刚 学 习 的 SVM 训练 与 分 其 付 诸 实践 ， 数 据 集 本 
且 共 150 个 样本 ， 每 个 样本 为 一 个 4 维 的 特征 回 量 ， 
这 4 维特 征 的 意义 分 别 为 : EIKE, {ЮЙ ТИЛУ, 


н ТЕЛЕН Н и» 1504F 727) T ЗЕ Fë 
属 植物 (每 类 50 个 样本 ) 。 实 验 中 只 用 了 前 二 维特 
征 ， 这 主要 是 为 了 便于 训练 和 分 类 结果 的 可 视 化 。 
为 了 六 时 训 开 多 类 问题 ， 将 样本 古 哪 一 类 的 3 类 问 
题 变 成 了 样本 是 不 是 “setosa” 类 的 两 类 问题 。 


相关 代码 如 下 。 


load fisheriris % 载 入 fisheriris 数 据 集 
data = [meas(:,1), meas(:,2)]; % 取出 所 有 样本 的 前 2 维 作为 


% 转化 为 “是 不 是 setosa 类 ”的 2 类 问题 
groups = ismember(species,'setosa'); 


% 利用 交叉 验证 随机 分 割 数 据 集 


[train, test] = crossvalind(' holdout ,groups); 


% 训练 一 个 线性 的 支持 同 量 机 ， 训 练 好 的 分 类 右 你 存在 svmStruct 
svmStruct = svmtrain(data(train,:),groups(train),'showp 
lot"' ,true); 


% 利用 包含 训练 所 得 分 类 器 信息 的 svmStruct 对 测试 样本 进行 分 类 ， 
分 类 结果 你 存 到 classes 

classes = svmclassify(svmStruct,data(test,:),'showplot' 
| true); 


% 计算 训 弃 样本 的 识别 率 


ans = пСоггес = sum( classes == groups(test,:) ); % IL 
确 分 类 的 样本 数目 
accuracy nCorrect / length(classes) % 计算 正确 率 


accuracy 
0.9867 


НА 
上 述 程序 的 运行 结果 如 图 16.10 所 示 。 


+ (training) 
一 O(classified) 
l(training) 


liclassitied ) 


| Support Vectors 
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图 16.10 ”两 类 SVM 的 训练 与 分 类 结果 
16.4 Zl 基于 PCA 和 
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人 脸 识 别 由 于 其 在 公安 部 门 、 安 全 验证 系统 、 
信用 卡 验 证 、 档 案 管理 和 人 机 交互 系统 等 方面 的 广 
阔 应 用 前 景 ， 已 经 成 为 当前 模式 识别 和 人 工 镶 能 领 
域 的 一 个 研究 热点 。 本 贡 将 回 读 者 展现 一 个 极 具 吸 
引力 的 综合 案例 一 基 于 PCA 和 SVM 的 人 脸 识 别 系 
统 ， 在 一 步 步 深 入 问题 的 同时 也 给 出 了 使 用 SVM 解 
决 回 题 的 一 般 框 淋 。 


16.41 人 脸 识 别 简介 


人 腔 识 别 技术 吏 是 以 计算 机 为 辅助 手段 ， 从 裔 
态 图 像 或 动态 图 像 中 识 列 人 脸 。 问 题 一 般 可 以 插 述 
为 : 给 定 一 个 场景 的 前 态 或 贫 频 图 像 ， 利 用 已 经 存 
储 的 人 脸 数据 库 确 认 场 景 中 的 一 个 或 多 个 人 人。 一般 
Kw, ЛЛА ЗА: MRAR 
录 表 景 的 场景 中 检测 并 分 离 出 人 脸 所 在 的 区 域 ， 抽 
取 人 脸 识 列 特 征 ; 然后 进行 匹配 和 识 询 。 


ЛОМУ RA Т ЛЛУ ААН ч 
Fa ХА ЛАУА ЛЛ АЖА еМ Fi КТЕ 
ЦУЕ CR У т\л BRAE, ТРИ 
觉 以 及 神经 生理 学 、 心 理学 等 诸多 研究 领域 。 


如 同人 的 指纹 一 样 ， 人 上 脸 也 具有 了 唯一 性 ， 可 用 
来 使 别 一 个 人 的 号 份 ， 人 脸 识 别 技术 在 商业 、 法 人 律 
和 其 他 领域 有 看 广泛 的 应 用 。 目 前 ， 人 上 脸 识 列 已 成 
为 法 律 部 门 打 击 犯 非 的 有 为 工具 ， 在 毒品 跟 踩 、 友 
仿 怖 活动 等 监控 中 有 看 很 大 的 应 用 价值 ， 此 外 ， 人 
脸 识 列 的 商业 应 用 价值 也 正在 日 益 增 长 ， 主 要 是 信 
用 卡 或 者 目 动 取 球 机 的 个 人 号 份 核对 。 与 利用 指 
A FP, WMA ESERE AEE RERET 
ЛА Л ЖЖП HE, ЛАТА AR Ж 
Hf. AER. FIER FAAARA ÀO 
理 障 但 。 


16.4.2 ВІЯНЬ 


实验 数据 集 仍 然 采 用 OREL 人 脸 库 。 由 于 每 幅 人 
脸 图 像 均 包括 112x92 个 像 系 “参见 13.4.1 小 节 )， 
巨大 的 维 数 打消 了 话 者 将 每 幅 图 像 明 接 以 其 像 系 作 
为 特征 (ANN 数 字 字 人 符 识 别 中 的 做 法 ) 的 念头 。 
而 实际 上 上， 由 于 原始 图 像 各 维 像 系 之 则 存在 看 大 量 
的 相关 性 ， 这 种 做 法 也 是 没有 必要 的 。 因 此 需要 首 
先 通 过 主 成 分 分 析 (PCA) 的 方法 去 除 相 关 性 ， 本 
书 将 在 13.4 节 那个 基于 主 成 分 分 析 PCA) 的 人 脸 
特征 提取 工作 的 基础 上 进行 本 实验 ， 将 PCA 降 维 后 
得 到 的 20 维 特征 同 量 作 为 SVM 分 类 的 特征 。 


六 期 预 处 理工 作 的 具体 步骤 如 下 。 

(1) 数据 集 的 分 割 

将 整个 数据 集 分 为 两 个 部 分 一 1 个 训练 集 和 1 
个 测试 集 。 具 体 地 说 ， 将 每 个 人 的 10 张 面部 图 像 分 
成 两 组 ， 前 5 张 放 入 训练 集 ， 另 外 5 张 用 作 测 试 。 这 
样 训 练 集 与 测试 集 各 有 40x5 = 200 个 人 脸 样 本 。 

(2) 谈 入 训练 图 像 


将 每 张 图 像 按 列 存 储 为 1 个 10304 维 的 行 问 量 。 
这 样 400 个 人 共 组 成 一 个 400x10304 的 二 维和 矩阵 


FaceContainer, 41/7115 ЛАРЕ А. ReadFeacs() K 
AER Г БУКВЕ, Н Р13.4.2/]%77 EANA 
ТРК, <H НАНЕ АЈА. 


function[imgRow,imgCol,FaceContainer,faceLabel]=ReadFac 
es(nFacesPerPerson,nPerson,bTest 


// 调用 时 bTest 为 true (1) 表示 谈 入 测试 样本 ; 默认 为 false (0) 


， 读 入 训练 样本 





(3) 利用 PCA 降 维 去 除 像 系 之 则 的 相关 性 


从 全 部 的 训练 样本 中 提取 主 成 分 ， 实 验 中 将 主 
成 分 的 数目 确定 为 20， 正 如 13.4.3 小 节 所 做 的 那 
样 。 通 过 投影 完成 基 的 转换 ， 每 个 10304 维 的 人 脸 
回 量 被 降 至 20 维 ， 在 后 续 的 计算 中 将 以 此 20 维 的 特 
征 向 量 来 代表 该 人 脸 样 本 。 这 些 工作 由 读者 熟悉 的 
国 数 fastPCAO 完 成 ， 其 详细 用 法 和 实现 细节 请 参见 
13.3.42 T- 


16.4.3 ”数据 规格 化 


数据 规格 化 〈Scaling) 又 称 数据 尺度 归 一 化 ， 
束 是 将 特征 的 茶 个 属性 〈 特 征 同 量 的 茶 一 维 ) 的 取 
值 范围 投射 到 一 个 特定 范围 之 内 ， 以 请 除数 信 型 属 
性 因 太 小 范围 不 一 而 影响 基于 距离 的 分 英 方 法 结束 
的 公正 性 。 


1. 数据 规格 化 的 必要 性 


可 以 本 不 夸张 地 说 ，Scaling 在 一 个 模式 识别 问 
题 中 占据 独 举 足 轻 重 的 地 位 ， 甚 至 关系 到 整个 识别 
系统 的 成 败 。 然 而 不 驻地 是 ， 如 此 重要 的 一 个 环 市 
却 往 往 易 被 初学 者 忽视 。 当 庶 者 在 同一 个 数据 集 上 
应 用 了 祖 同 的 分 类 亏 却 得 到 远 不 如 他 人 的 结 末 时 ， 
首先 请 确定 谈 着 十 合 进行 了 正确 的 Scaling。 通 单 进 
行 Scaling 一 般 有 以 下 两 点 必要 性 。 


(1) 防止 那些 处 在 相对 较 大 的 数字 范围 
(Numeric Ranges) 的 特征 压倒 那些 处 在 相对 较 小 
的 数字 范围 的 特征 。 举 例 来 说 ， 谍 者 全 到 了 一 份 体 
仿 报 竺 的 数据 : 其 中 的 一 个 特征 为 吴 遍 ， 单 位 为 米 
(m) ， 这 样 访 特 征 的 数字 范围 可 能 残 在 [1.2， 
2.5]， 相 对 于 用 公斤 (kg) 作为 单位 的 体重 特征 [35， 
120] 来 说 ， 刁 高 特征 无 疑 是 处 在 一 个 相对 很 小 的 数 
字 范 围 。 而 很 多 分 类 器 ， 包 括 SVM， 都 是 基于 欧 氏 
距离 的 ， 这 样 如 果 选 用 这 2 维特 征 进行 分 类 ， 处 在 
小 范围 的 有 刁 遍 由 于 对 距离 的 计算 没有 什么 页 献 ， 分 
类 项 将 几乎 只 根据 体重 特征 来 分 类 而 不 考虑 样本 间 
Б) ЖЕ УЕ o 

图 16.11 给 出 了 这 种 情况 下 的 样本 二 维 空间 分 
布 ， 这 有 助 于 理解 数字 范围 差异 是 如 何 影 啊 距 离 计 
算 ， 进 而 影响 基于 欧 氏 距离 的 分 类 器 的 。 很 明显 在 


图 16.11 (b) 中 ， 样 本 之 间 几 乎 体现 不 出 身高 关 
异 ， 假 设 两 个 人 A、B 分 别 高 1.6m 和 2m， 体 重 相 
等 ; УЛС. Р 吴 局 相等 ， 体 重 分 别 为 75kg 和 
76kg。 此 时 基于 欧 氏 距离 的 分 类 右 会 认为 A、B 两 
人 更 为 相似 《空间 欧 氏 距离 为 0.4) , ШС, D 两 人 
则 差异 较 大 《空间 欧 氏 距离 为 1) 。 这 显然 与 读者 
第 规 的 判断 相反 。 


ЕР (m) | ЕР (m) 
i i 
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Е: 为 便于 说 明 问 题 样 本 扣 古 等 概率 随机 生成 
而 个 像 一 般 真 实数 据 那样 成 正 态 分 布 。 


(2) 避免 计算 过 程 中 可 能 会 出 现 的 数字 问 
题 。 例 如 在 计算 SVM 的 核 浮 数 时 通常 需要 计算 特征 
回 量 的 内 积 《〈 线 性 核 图 数 以 及 多 项 却 核 图 数 ) ， 较 
大 的 特征 取 值 可 能 造成 最 终 的 内 积 结果 太 大 以 至 于 


超出 计算 机 的 表示 范围 而 溢出 。 针 对 这 种 情况 本 书 
建议 线性 地 缩放 各 个 属性 到 统一 的 范围 [-1，+1H] 或 
10, 1]. 


МУХА IUE е K ВУ a Scaling h k НУ = ЇН) 
题 是 在 很 多 需要 计算 复合 概率 情况 下 《马尔 可 夫 模 
型 Marcov Model) ， 此 时 需要 计算 很 多 信 的 连 
来 积 ， 由 于 概 诬 取 值 都 在 0 和 1 之 间 ， 这 人 很 有 可 能 造 
成 连 乘 积 太 小 以 至 局 精度 浮 点 数 都 无 法 表示 而 下 淤 
出 。 这 束 需 要 在 每 步 运 径 之 后 对 数据 进行 等 比例 的 
ee PP E PE 
以 内 。 


2. 数据 规格 化 方法 


在 训练 之 前 ， 需 要 对 训练 集中 的 全 体 样 本 进行 
дш 一 般 来 说 ， 有 有 以 下 两 种 第 见 的 数据 规格 化 
И у 


(1) 最 大 最 小 规格 化 方法 
该 方法 对 被 初 始 数据 进行 一 种 线性 转换 。 设 
min д 和 max д 分 别 为 属性 A 的 最 小 和 最 大 值 。 最 大 


最 小 规格 化 方法 将 属性 A 的 一 个 值 v 映射 为 v' 且 有 
ve powin neumna] 。 具 体 映射 计算 公式 如 下 





UU — mina 


maxa — mina 





(пеш_таха — near mina) + near _ mina 


(16-33) 


例如 ， 属 性 “体重 ”的 最 大 最 小 值 分 别 十 40kg 和 
120kg， 利 用 最 大 最 小 规格 化 方法 将 属性 A 的 值 映 
ЯУ ra [-1,1]J EAN, ЯДА 的 值 75kg 将 被 转 
化 为 : 


u, 一 ST АЕ) qp an 
(2) 零 均 值 规格 化 方法 
该 方法 是 根据 属性 A 的 均值 和 偏差 来 对 A 进行 
规格 化 ， 可 将 训 纤 集中 的 每 个 样本 特征 的 均值 统一 
变换 为 0， 并 且 都 具有 统一 的 方 震 〈 如 1.0) 。 属 
性 A 的 v 值 可 以 通过 以 下 计算 公式 获得 其 映射 值 w' 


О 


(16-34) 


ЖЕН, ид 和 oa 272117) ЕАНЈЉЈИНА7 2 , 


ТЕЛУ 





零 均 信 规格 化 方法 种 用 于 属性 A 的 最 大 值 与 最 小 值 未 知 的 情况 。 


当然 ， 在 测试 阶段 该 着 必须 对 测试 样本 应 用 同 
样 的 Scaling 技 术 。 比 如 说 采用 最 大 了 最 小 规格 化 方法 
将 训 绎 数据 菏 一 维 从 [-10，+10] 线 性 纵 放 人 至 
[-1，+1]， 那 么 也 要 对 调试 数据 的 谱 维 应 用 相同 的 
变换 规则 -+ 元 Prxua-Cub)， 即 如 测试 数据 在 该 维 上 
处 在 范围 [-11，8]， 应 缩放 至 [-1.1，+0.8]。 


3. 实现 人 上 脸 特征 数据 的 规格 化 


下 是 基于 前 述 原 因 ， 在 将 降 维 后 的 数据 交 给 
SVM 处 理 之 前 ， 首 先 需要 进行 Scaljing。 这 里 选择 第 
1 种 方法 ， 线 性 地 缩放 特征 的 各 个 属性 《维度 ) 到 
[-1, +1] 


人 脸 特征 数据 规格 化 的 完整 实现 如 下 ， 它 被 封 
站 在 随 书 光 极 的 “chapterl6\code\FaceRec” 日 录 下 的 
scaling.m Ж F - 








function [SVFM, lowVec, upVec] = scaling(VecFeaMat, bTe 
st, lRealBVec, uRealBVec) 


% Input: VecFeaMat --- 需要 scaling 的 m*n ДЕШЕ, F 
行 一 个 样本 特征 同 量 ， 列 数 为 维 数 

% bTest --- =1: 说 明 是 对 于 测试 样本 进行 scaling， 
此 时 必须 提供 lRealBVec 和 uRealBVec 

% 的 什 ， 此 二 值 应 该 是 在 对 训练 样本 


scaling 时 得 到 的 


% -0: 默认 值 ， 对 训练 样本 进行 scalin 


% о --- n 维 向 量 ， 对 训练 样本 scaling 时 得 
到 的 各 维 的 实际 下 限 信息 lowVec 

% о --- n 维 回 量 ， 对 训练 样本 scaling 时 得 
到 的 各 维 的 实际 上 限 信 息 upVec 

加 

% output: SVFM --- VecFeaMat 的 scaling 版 本 

% upVec --- 各 维特 征 的 上 限 ( 只 在 对 训练 样本 scaling 时 

有 意义 ，bTest = 0) 

% lowVec --- 各 维特 征 的 下 限 ( 只 在 对 训练 样本 scaling 


上 时 有 意义 ，bTest = Ө) 
if nargin < 2 

bTest = 0; 
end 


% АН E-I, 1] 
1ТагрВ = -1; 
ulargB = 1; 


[m n] = size(VecFeaMat ) ; 
SVFM = zeros(m, n); 


1f bTest 
1f nargin < 4 
error('To do scaling on testset, param 1Кеа1В 
and uRealB are needed. '); 
end 


1f nargout > 1 
error('When do scaling on testset, only one ou 
tput is supported.'); 
end 


for iCol = 
if uRealBVec(iCol) == 1Кеа1В\№ес(1іСо1) 


SVFM(:, iCol ретт 
ЅМЕМ( :, iCol 
else 
SVFM(:, iCol) = lTargB + ( VecFeaMat(:, i 
Col) - lRealBVec(iCol) ) / ( uRealBVec(iCol)-lRealBVec( 
iCol) ) * (uTargB-lTargB); % 测试 数据 的 scaling 
end 
end 


) = и 
) = 6 


else 
upVec = zeros(1, n); 
lowVec = zeros(1, n); 


for iCol = 1: 
lowVec(iCol) = min( VecFeaMat(:, iCol) ); 
upVec(iCol) = max( VecFeaMat(:, iCol) ); 
if upVec(iCol) == lowVec(iCol) 
SVFM(: , iCol) = кн 
SVFM(:, iCol) = 
else 
SVFM(:, 1Со1) = lTargB + ( VecFeaMat(:, i 
Col) - lowVec(iCol) ) / ( upVec(iCol)-lowVec(iCol) ) * 
(uTargB-lTargB); % 训练 数据 的 scaling 
end 
end 
end 


16.44 1% PK 172637 


ЈН BU Ji, Z: ЛЅУМЕЈ TS Pl Ze #E $$ 09 
绪 ， 但 在 “局 动 "SVM 让 它 为 谈 者 工作 之 表 仍 有 两 个 
问题 摆 在 面前 : OAA A (Kernel) ; 


@ E РАЈ DU Ж КИТ A MC 的 最 佳 取 
值 。 下 面 先 来 解决 第 1 个 问题 ， 第 2 个 问题 留 到 
16.4.5 中 。 


由 于 只 有 4 种 第 用 的 核 闲 数 〈 参 见 16.2.3 小 
三)， 将 它们 依 砍 笠 试 并 选择 对 测试 数据 效果 最 好 
的 一 个 似乎 也 是 个 行 得 通 的 方法 ， 但 后 续 的 参数 选 
择 问 题 将 使 这 成 为 一 个 复杂 有 的 排列 组 合 问题 ， 而 远 
远 不 是 4 种 可 能 那么 简单 。 


尽管 最 佳 核 玫 数 的 选择 一 般 与 问题 自身 有 关 ， 
但 还 是 有 规律 可 循 的 。 建 议 初 学 者 在 通常 情况 下 优 
先 考 虑 径 同 基 核 图 数 (RBF) : 


К(т,у) = ехр(—7||= — yll”) 
这 主要 基于 以 下 考虑 。 


(1) 作为 一 种 对 应 于 非 线性 映射 的 核 困 数 ， 
RBF 能 够 处 理 非 线 性 可 分 的 情况 。 


(2) 线性 核 函 数 是 RBF 核 函数 的 一 种 特殊 情 
况 ， 即 退 过 适当 地 选择 参数 (y ,C ) , ЕВЕР 
总 可 以 得 到 与 市 有 和 锋 误 代价 参数 C 的 线性 核 冰 数 相 
同 的 效果 ， 肥 之 当然 不 成 了 并。 


(3) 在 选择 茶 些 参数 的 情况 下 ，Sigmoid 核 函 


к(а.) = tanh (ble и) – с) АУА ГЕВЕ AŽ ПП 
有 选择 Sigmoid 核 函数 束 有 2 个 与 之 有 关 的 参数 b . с 
需要 确定 。 


(4) 多 项 却 核 图 数 需 要 计算 内 积 ， 而 这 有 可 
ВЕ Ей С ЖИ ЭУ ЇН] АЛ. 


工具 箱 中 的 RBF 核 函 数 无 法 元 话 地 选择 参数 ， 
为 了 方便 设置 参数 y ， 本 太 编 号 了 目 己 的 RBF 核 耳 
数 kfun_rbf()， 孙 数 的 完整 实现 位 于 随 书 区 
Жї “сһаргег1б\соде\ЕасеКес\Кегпе!” Н >& F RJ 
kfun_rbf.m X14 .- 


function K = kfun_rbf(U, V, gamma) 
% rbf 核子 数 


[m1 n1] 
[m2 n2] 


size(U); 
size(V); 


К = zeros(m1, m2); 
for ii = 1:m1 
for jj = 1:m2 
K(ii, jj) = exp( -gamma * norm(U(ii, :)-V( 
:))^2 ); 
end 





16.4.5 ”参数 选择 


在 选择 了 RBF 核 的 情况 下 总 共有 两 个 参数 需要 
傅 定 ，RBEF 核 目 身 的 参数 y 以 及 错误 代价 系数 C 。 
这 个 问题 本 里 束 是 一 个 优化 问题 ， 和 变量 是 C Ну, 
目标 函数 值 束 是 SYM 对 于 测试 集 的 识别 紊 。 困 难 在 
于 很 难 用 变量 C My 写 出 目标 函数 的 表达 式 ， 因 此 
不 适 于 采用 一 般 的 优化 策略 。 笠 好 在 LibSVM (2 
见 16.5.2 小 节 ) 中 林 智 仁 (Chih-Jen Lin) 博 士 为 读者 
提供 了 一 个 非常 实用 的 基于 交叉 验证 和 网 格 搜索 的 
参数 选择 方法 ， 并 提供 了 相应 的 工具 grid.py， 具 体 
可 参见 文献 [13]。 随 后 将 结合 人 脸 识 别 的 问题 给 出 
参数 搜索 工具 的 使 用 方法 ， 读 者 将 学 习 到 如 何在 基 
于 MATLAB 的 SVM 应 用 中 获得 工具 grid.py 的 有 力 帮 
助 。 


1. 数据 集 格式 化 

要 利用 LibSVM 的 参数 选择 工具 grid.py， 首 先 
需要 把 数据 集 格式 化 为 grid.py 所 要 求 的 形式 ， 即 为 
如 下 格式 的 文本 文件 : 


< 类 标 窒 > < 特征 索引 1>:< 特 征 全 1> < 特征 索引 2>:< 
特征 值 2> ... «Е 51 п>: «ЕЁ п> 


其 中 ， 每 行 对 应 一 个 样本 实例 。 


对 于 分 类 问题 ，< 类 标 信 > 是 一 个 表示 类 列 标 写 
的 整数 ， 其 后 的 “< 特征 索引 >:< 特 征 值 >” 对 儿 给 出 
了 每 一 维 的 特征 取 值 ，< 特 征 和 索引 > 十 一 个 从 1 开始 
未 渐 建 增 的 整数 ，< 特 征 值 > 是 一 个 实数 。 


本 书 编写 的 export0) 函 数 用 于 从 MATLAB 导 出 
LibSVM 能 够 使 用 的 数据 ， 它 彼 封 竣 在 随 书 共 
1% “сһаріег16\соае\ЕасеВес\ехрогї1ь5УМ” Н >< F HJ 
export.m 文 件 中 。 其 相应 代 但 如 下 。 


function export(strMat, strLibSVM) 
% 将 以 参数 strMat 指定 的 文件 (.mat 文 件 ) 中 的 数据 导出 为 能 够 


% 输入 : strMat --- 源 文件 名 【包括 路 径 ) ， .mat' 文 件 ， 默 认为 
'../Mat/trainData.mat'， 其 中 必须 包含 训练 数据 


% TrainData 和 类 标签 trainLabel， 该 文 
件 可 在 训练 SVM 过 程 中 生成 
% strLibsVM --- 目标 文件 名 (包括 路 径 〉，"' .txt' 文 件 ， 


ЧЛ Уу 'trainData.txt' 


1f nargin < 1 
strMat = '../Mat/trainData.mat'; 
strLibSVM = 'trainData.txt'; 
elseif nargin < 2 
strLibSVM = 'trainData.txt'; 


end 


[fid, fMsg ] = fopen(strLibSVM, 'w'); % 建立 目标 输出 文件 
if fid == -1 

disp(fMsg ); 

return 
end 


strNewLine = [13 10]; % 换行 
strBlank = ' '; 


load(strMat) 
[nSamp, nDim] = size( TrainData ); 
for iSamp = 1:nSamp 
fwrite(fid, num2str(trainLabel(iSamp)), 'char'); 
for iDim = 1:nDim 
fwrite(fid, strBlank, 'char'); 
fwrite(fid, [num2str(iDim) ':'], 'сһаг'); 
fwrite(fid, num2str(TrainData(iSamp, iDim)), 
'char'); 
end 
fwrite(fid, strNewLine, 'сһаг'); 


end 


fclose(fid); 


上 述 程序 执行 后 ， 第 2、3 个 人 的 人 脸 样本 对 应 


村 trainData.txt 中 的 如 下 两 行 。 


2 1:0.17762 2:0.054549 3:0.68467 4:-0.032753 
92:-0.076314 6:-0.1758 7:0.37941 8:-0.039629 
9:-0.54754 10:0.091465 11:0.13723 12:0.19647 
13:0.36674 14:-0.50934 15:0.7817 16:-0.22577 
17:0.070553 18:0.10225 19:-0.26392 20:0.01075 


З 1:-0.10874 2:-0.239 3:-0.16797 4:-0.26408 
5:0.53417 6:0.48635 7:-0.11967 8:-0.051977 
9:-0.030884 10:-0.60206 11:-0.27395 12:-0.36117 
13:0.23001 14:0.082984 15:0.13227 16:0.090856 
17:-0.25932 18:0.094344 19:-0.59063 20:0.90311 


2. 搜索 参数 


参数 搜索 工具 grid.py 丰 python 的 脚本 文件 ， 所 
以 首先 系统 必须 安装 python。 此 外 搜索 过 程 中 还 要 
用 到 工具 gnuplot.exe 以 便 将 搜索 过 程 可 钢化 。 关 于 
python 和 gnuplot 变 者 都 可 以 在 互联 网 上 找到 。 


在 开始 沫 单 运行 命令 窗口 中 和 输入 cmd 命 令 ， 打 
开 命令 提示 符 后 ， 转 移 至 grid.py 所 在 的 目录 ， 在 命 


令 行 中 输入 命令 “grid.py trainData.txt*”， 如 图 16.12 所 
A 


ex CAFINDOTS systenm32\ cad. ез - D х 





Е: "sLibSUM>grid.pu trainData.txt 





416.12 ”运行 grid.py 


如 入 命令 运行 中 出 现 问 题 ， 很 可 能 是 grid.py 中 
的 路 径 设 置 需 要 修正 ， 以 便 grid.py 可 以 找到 
svmtrain.exe 和 pgnuplot.exe 的 位 置 。 图 16.13 给 出 了 
路 径 设 置 的 方法 : 打开 grid.py 文 件 ， 修 改 字母 “r” 后 
面 引 所 中 的 路 径 到 svmtrain.exe 和 pgnuplot.exe 所 在 
的 路 径 即 可 。 疼 中 的 路 径 放 置 对 应 于 svmtrain.exe 和 
pgnuplot.exe 与 grid.py 处 在 相同 目录 下 的 情况 。 


加 芷 后 开始 目 动 参数 搜索 ， 搜 索 结 未 如 图 16.14 


所 示 的 倒数 第 2 行 ， 得 到 最 佳 的 C 18 74128, эү 
(图 中 为 g) 为 0.0078125， 训 练 集 上 交叉 验证 的 识 
1] 7у97.5%. 


| #'zusr/bin/env python 


import оз, SVE, traceback 

impart Queue 

import getpass 

trom threading import Thread 

from string impart find, split, join 
from subprocess import * 


# svmtrain and gnuplot executable 


is_ win32 = (sya.platform == !win32') 
if not is vinjs: 
swvmtraāain ехе = m ./svmu-train" 
gnuplot ехе = "/usr/bin/gnuplot" 
else: 


# example for windows 
mw t r ajh exe = O ONS hb tt = Hh We th ENE 


gnuplot exe ж=огунир1осех 






# global parameters and their default values 


图 16.13 grid.py 中 的 路 径 设 置 














са :IHDOTS systenmnid2 cad. exe 


-i -3 91.B «hest с=128.0. gq=B.BB78125, кабе=9'7.55 
ii -3 97.0 «hest с=128.0. g=0.0078125,. rate=97.5» 
-3 -3 91.B «hest с=128.0. og=H.M0r8125,. кабе=9'7.5 5 
7 -3 УД: Же ЕЗ с=128.0. g=0.0078125,. rate=97.5» 
3 -3 97.B <hest c=128 B. g=6. 0078125. rate=97?.5)5 
15 -3 9?.B «hest с=і28.0. g=0.0078125,. rate=97.5)5 
-5 -3 91.B «hest с=128.0. g=0. 0078125. rate=9?7.52) 
7 —3 90.08 <hest с=і28.0. Gg=B_BB78125., каёе=9'7.5 5 
1 -3 96.08 “<Khest с=1і28.0. ч=0.00'78125. rate=97.59 
13 -7 97.5 «hest с=128.0. g=0.0078125,. кае =9'7.55 
13 -i 96.5 «hest с=1і28.0. g=0.0078125,. каёе=9'7.5 5 
13 -i3 97.5 Khest с=і28.0. dg=B_BB78125. кабе=9'7.55 
13 1 81.5 рех c=128.B. g=0. 0078125. каёе=9'7.5 5 
13 -ii 97.5 <hest с=і28.0. g=B._ BB7?8125., кабе =9'7.5 5 
13 — 97.5 «hest с=128.0. g=0.0078125,. rate=97.59) 
13 -ib 95.0 <þbest с=і28.0. g=B._ BB7?8125., кабе =9'7.5 5 
13 3 57.08 <Khest с=128.0. ч=0.00'78125. rate=97?._5)5 
13 — 97.5 «hest с=128.0. g=0.0078125,. rate=9?7.5) 
13 -3 97.08 «hest с=128.0. q=B.BB78125,., каёе=9'7.5 5 
128.0 56.0078125 97.5 


F: SLibSUH> 





图 16.14 ”grid.py 中 的 路 径 设 置 
16.4.6 ”构建 多 类 SVM 分 关 器 


16.2.4 小 节 已 经 介绍 了 如 何 应 用 1 对 1 的 投票 全 
略 将 SVM 推广 至 多 类 问题 ， 下 面 给 出 访 方 法 的 实现 
细 广 。 本 市 编 与 了 孙 数 multiSYMTrainO 和 和 
multiSVMC]lassifyO 作 为 标准 SVM 工具 箱 的 扩展 ， 
从 而 得 到 可 以 解决 多 类 问题 的 SVML。 


1. ЖЇН UJU ZE 


ТЕ 5 2&®5Уу МУД йг, Apu Bumi. Н п 
=40 类 样本 构建 n (n - 22 SVM 755, EREA 


SVM 二 分 器 的 训练 结果 〈SVMStruct 结 构 体 ) 都 保 
存 到 一 个 结构 体 的 细胞 数组 CASVMStruct 中 ， 具 体 
地 说 ，CASVMStruct{ii jj } 中 你 存 看 第 这 265 
类 两 类 训练 得 到 的 SVMStruct。 最 终 将 多 类 SVM 分 
类 时 需要 的 全 部 信息 保存 全 结构 体 multiSYMStruct 
中 返回 ， 可 以 说 multiSYMStruct 中 包含 了 本 节 的 训 


multi SYMTrain() 的 完整 实现 如 下 ， 它 个 封 装 在 
随 书 光盘 “chapter16\code\FaceRecCSVM2 目录 下 的 
multiSVMTrain.m 文 件 中 。 


function multiSVMStruct = multiSVMTrain(TrainData, nSam 
pPerClass, nClass, C, gamma) 

% 采用 1 对 1 投票 策略 将 SVM 推广 至 多 类 问题 的 训练 过 程 ， 将 多 类 SV 
M 训 练 结果 保存 至 multiSsVMSstruct 中 

% 

% 输入 :--TrainData: 每 行 是 一 个 样本 人 上 脸 


% --nClass: 人 数 ， 即 类 别 数 
% --nSampPerClass:nClass#x1 维 的 问 量 ， 记 录 每 类 的 样本 数目 


， 如 nSampPerClass(iClass) 
给 出 了 第 icClass 类 的 样本 数目 
-- C: ПЛИТА, AAN Inf 
- -gamma : £ |H] 11 172 gamma, AWE 51 


SS 55 XN XN N 


输出 :--multiSsVMStruct: 一 个 包含 多 类 SVM 训 练 结果 的 结构 体 


% 默认 参数 

if nargin < 4 
C = Inf; 
gamma = 1; 


elseif nargin < 5 
gamma = 1; 
end 


% 开 始 训练 ， 需 要 计算 每 两 关 间 的 分 类 超 平 面 ， 共 (nClass-1)*nC1las 
5/24 
for ii=1:(nClass-1) 

for jj=(ii+1):nClass 


clear X; 

clear Y; 

startPosII = sum( nSampPerClass(1:ii-1) ) 
+ 1; 

endPosII = startPosII + nSampPerClass(ii) 
- 1; 


X(1:nSampPerClass(ii), :) = TrainData(star 
tPosII:endPosII, :); 


startPosJJ = sum( nSampPerClass(1:jj-1) ) 


endPosJJ = startPosJJ + nSampPerClass(jj) 


X(nSampPerClass(ii)+1:nSampPerClass(ii)+nS 
ampPerClass(jj),:)=TrainData 
(startPosJJ: endPosJJ, :); 


% 设 定 两 两 分 类 时 的 类 标签 

Y = ones(nSampPerClass(ii) + nSampPerClass 
(jj), 1); 

Y(nSampPerClass(ii)+1:nSampPerClass(ii)+nS 
ampPerClass(jj)) = 0; 


% ІЛУ ЛАВУ УЛУ ЛИУ НА МИЕ El 
CASVMStruct{ii}{jj}= svmtrain( X, Y, 'Кегп 
el Function', @(X,Y) kfun rbf(X,Y, 


gamma),'boxconstraint', C ); 
end 
end 


% 己 学 得 的 分 类 结 
multiSVMStruct.nClass = nClass; 
multiSVMStruct.CASVMStruct = CASVMStruct; 


% 你 存 参数 


save( ' Mat/params .mat ， 'C', 'gamma'); 





2. 多 类 问题 的 分 类 


在 多 类 SVM 分 类 阶段 ， 让 测试 样本 依次 经 过 训 
练 得 到 的 n (n - 1)/2 个 (n= 40) 个 SVM 二 分 器 ， 通 
过 投票 决定 其 最 终 类 列 归 属 。 


multi SYMClassify() 的 实现 如 下 ， 它 被 封装 在 随 
Pt “chapter16\code\FaceReA\SVM” Н ж ЕЕ] 
multiSVMClassify.m 文 件 中 。 





function class = multiSVMClassify(TestFace, multiSVMStr 
uct) 

% 采用 1 对 1 投票 策略 将 SVM 推广 至 多 类 问题 的 分 类 过 程 

% 输入 :--TestFace: 测 试 样本 集 。m*n 的 2 维 定 阵 ， 每 行 一 个 测试 样 
本 

% --multiSVMStruct: ZZŠSSVMHJVIZkKZ8 E, НРА multiSVMT 
rain 返回 ， 默 认 是 从 Mat/multisvMTrain.mat 文 件 中 读 取 

% 

% 输出 :--class: m*1 列 回 量 ， 对 应 TestFace 的 类 标签 


% 读 入 训练 结 
1f nargin < 2 

t = dir('Mat/multiSVMTrain.mat'); 

if length(t) == 

error (' 192 211011229 306, HETARA A HET 

ДЖ! '); 

епа 

load('Mat/multiSVMTrain.mat'); 
end 


nClass = multiSVMStruct.nClass; % 读 入 类 别 数 
CASVMStruct = multiSVMStruct.CASVMStruct; % 读 入 两 两 类 之 
间 的 分 类 器 信息 


%%%%%%%%%%%%% 投 昧 傈 略 解决 多 类 问题 БИБ 
m = size(TestFace, 1); 
Voting = zeros(m, nClass); % m 个 测试 样本 ， 每 个 样本 nPerson 
个 类 别 的 投票 箱 
for ilndex = 1:nClass-1 
for jIndex = ilndex+1:nClass 

classes = svmclassify(CASVMStruct{iIndex}{jIn 

dex}, TestFace); 


% 投票 

Voting(:, iIndex) 
ses == 1); 

Voting(:, jIndex) 
ses == 0); 


Voting(:, іІпаех) + (clas 


Voting(:, jIndex) + (clas 


end % for jClass 
end % for iClass 


% final decision by voting result 
[vecMaxVal, class] = max( Voting , [ ], 2 ); 
%display(sprintf('TestFace 对 应 的 类 别 是 :%d' ,class) ) ; 





16.4.7 RER 


ZFR. АНЕ lee B ДАН 
到 分 类 器 对 于 每 个 人 的 后 5 张 图 片 的 识别 效果 了 。 
本 市 将 有 天 这 个 人 脸 识 列 系统 实现 的 所 有 文件 部 存 
放 在 随 书 光盘 的 “chapter16\code\FaceRec” 目 录 中 ， 
AO AR EAE E 


根 目 录 下 主要 是 一 些 驱 动 文件 ， 它 们 的 作用 是 
ИДӘНЕ х НУ) BE РЕ Ж РД ЕЛИ 0 ИВЛ HU ЕЛЕ 
к е, 。 9 618: ВеайҒасеѕ. ті X scaling.m Z Bl С 
经 介绍 过 了 ， 其 余 的 将 在 剩 下 的 讨论 中 给 予 说 明 。 
各 个 目录 的 内 容 如 下 。 


All Files Т Туре = SITE Last Modifie 





ic Data Folder 2008-8-7 11:1 
D exportLibSw М Folder 2008-5-3 20:5 
I Kernel Folder 2008-7-26 20 
I Mat Folder 2008-8-6 20: 
D РСА Folder 2005-5-6 13:4 
i =k dki Folder 2005-5-6 14: 
ЕВ classify. m "l-file 1 KE 2008-8-6 14:7 
EIFE Gul m "l-file 2 КВ 2008-5-7 11: 
Em GUlOpenFacelmage.m  Ml-file 1 KB 2007-10-30 6 
Ев GUlRecgFacelmage.m M-file 1 KB 2007-10-30 Б 
Ев ReadaFace.m "l-file 1 KB 2008-7-28 17 
ЕВ FeadFaces.m "l-file 2 КБ 2008-5-6 13:4 
scaling. m "l-file 2 KB 2008-7-30 15 
ËEmtest.m "l-file 2 КВ 2008-5-6 14: 
ЕВ train. m "l-file 2 КВ 2005-5-6 20:8 


416.15 “FaceRec 工 程 一 览 


(1) Data/: 存放 着 ORL 人 脸 库 图 像 文 件 
(.pgm)- 


(2) exportLibSVM/: ë X Fexport.m, Ж 
存放 导出 的 LibSVM 格 式 的 文件 。 


(3) Kernel: FHE XKR WAW 
个 文件 kfun_rbfm 和 kfun_sigmoid.m 。 


(4) Май: 存放 所 有 的 matri L- 


(5) РСА/: fastPCA.m 和 visualize_pc.m， 这 是 
本 书 在 第 13 章 中 建立 的 PCA 工 具 箱 。 


(6) SVM/: 多 类 SVM 工具 箱 ， 包 括 
multiSVMTrain.m 和 multiSVMClassify.m 两 个 文件 。 


本 节 编 写 了 图 形 界 面 程序 FR_GUI 以 方便 读者 
驱动 整个 实验 ， 实 现 如 下 。 





% FR_GUI.m 


global h ахеѕ1; 
global һ ахеѕ2; 
h f = figure('name', ' 基 于 PCA 和 SVM 的 人 脸 识 别 系统 ' ) ; 


h textC = uicontrol(h f, 'style', 'text', 'unit', nornm 


alized', 'string', 'C=', 'position',... 
[0.05 0.7 0.1 0.06]); 
h editC = uicontrol(h f, 'style', 'edit', 'unit', 'norm 
alized', 'position', [0.05 @.6 0.1 0.06] ,... 
'callback', 'C = str2num(get(h editC, ''string''))' 
); 
h textGamma = uicontrol(h f, 'style', 'text', 'unit', 
normalized', 'string', 'gamma=', 'position',... 
[0.05 0.5 0.1 0.06]); 
h editGamma = uicontrol(h f, 'style', 'edit', 'unit', 
normalized', 'position', [0.05 0.4 0.1 0.06],... 
'callback', 'gamma = str2num(get(h editGamma, 


ing''))'); 


% 取得 参数 С 和 gamma 的 当前 值 ， 即 最 近 一 次 训练 所 使 用 的 什 
t = dir('Mat/params .mat ) ; 
if length(t) == 
% 没有 找到 参数 文件 
C = Inf; 
gamma = 1 
else 
load Mat/params.mat; 
end 


str 


set(h editC, 'string', num2str(C)); 
set(h editGamma, 'string', num2str(gamma)); 


h_axes1 = axes('parent', h f, 'position', [0.25 0.23 е. 
32 0.6], 'visible', 'off'); 
h ахеѕ52 = axes('parent', h f, 'position', [0.62 0.23 Ө. 
32 0.6], 'visible', 'off'); 
h btnOpen = uicontrol(h f, 'style', 'push', 'string', 
{ТЖ', 'unit', 'normalized',... 

'position', [90.32 0.1 0.18 0.1], 'callback', 'GUIOp 
enFaceImage'); 
h btnRecg = uicontrol(h f, 'style', 'push', 'string', 


识别 " ， 'unit', 'normalized', 

'position', [90.67 0.1 0.18 0.1], 'callback', GUIRe 
cgFaceImage'); 
h_btnRecg = uicontrol(h f, 'style', 'push', 'string', 
训练 " ， "unit' ， 'normalized', 

'position', [0.32 0.83 0.18 0.1], 'callback', tral 
n(C, gamma)'); 
h_btnRecg = uicontrol(h f, 'style', 'push', 'string', 
测试 " 'unit', 'normalized', 

'position', [0.67 0.83 0.18 0.1], callback ， test 
'); 





在 Matlab 命 令 窗 口中 输入 : 


% 将 工程 所 在 文件 夹 FaceRec 添 加 到 系统 路 径 列表 
>> addpath(genpath('F:Ndoctor research\Matlab WorkNFace 
Rec')) 


>> FR_GUI 





上 述 命 令 运 行 后 将 局 动 了 如 图 16.16 所 示 GUI 识 
别 程 序 。 


-+À Figure 1: #PFECAH STEN AGIRA Z т 


File Edit View Insert Tools Desktop Window He 





416.16 ТІНЕ Е Я] 
1. 训练 


ТЕЛ EA H Ze ЈАН ЛЕ Н] И E Z22% C 和 
y СЁ Јватта) ， 由 于 在 开始 时 还 没有 进行 训 
Zk, С 和 gamma 分 别 取 其 默认 值 Inf 和 和 1， 以 后 编辑 
т лака каннын 的 C 和 gamma 


里 击 “训练 ”按钮 会 调用 疯 数 train(C , gamma), 


其 中 包括 了 读 入 人 脸 数 据 、PCA 降 维 、 数 据 规格 化 
以 及 训练 多 类 SVM 等 功能 。 


train0O 函 数 的 完整 实现 如 下 ， 它 位 于 工程 目录 
下 的 train.m 文 件 中 。 


function train(C, gamma) 

% 整个 训练 过 程 ， 包 括 读 入 图 像 ，PCA 降 维 以 及 多 类 SVM 训练 ， 各 个 
阶段 的 处 理 结果 分 别 你 存 全 文件 : 

% ”将 РСА 变换 矩阵 W 保存 至 Mat/PCA.mat 

% 将 scaling 的 各 维 上 、 下 寞 信息 体 存 全 Mat/scaling.mat 

% 将 РСА 降 维 并 且 scaling 后 的 数据 保存 全 Mat/trainData. 
mat 

% ”将 多 类 SVM 的 训练 信息 保存 全 Mat/multiSVMTrain.mat 


global imgRow; 
global imgCol; 


display(' '); 
display(' '); 
display(' 训练 开始 ...'); 


nPerson=40; 

nFacesPerPerson = 5; 

display (' RAA RAE... ); 
[imgRow,imgCol,FaceContainer,faceLabel]=ReadFaces(nFace 
sPerPerson,nPerson); 

save( 'Mat/FaceMat.mat', 'FaceContainer') 

GLISDLaV Go о кюйле ОА “у 


nFaces=size(FaceContainer,1);%Ë' K (ЛЛ) 数目 


display('PCA 降 维 ...'); 


[pcaFaces, W] = fastPCA(FaceContainer, 20); % 主 成 分 分 析 
PCA 
% pcaFaces 是 206*26 的 窃 孟 ， 每 一 行 代 表 一 张 主 成 分 脸 ( 共 46 人 ， 
ТА н АШ 

А АРНА ВЕ, 10304*20 的 矩阵 
аи уте. 
AE ОЛЕ ЕРРЕТИ a РНР НЕ у; 


= рсаРасе<; 


display('Scaling...'); 
[Х,АӨ,ВӨ] = scaling(X); 
save( 'Mat/scaling.mat', 'A0', 'Вө'); 


% 保存 scaling 后 的 训练 数据 至 trainData.mat 

TrainData = X; 

trainLabel = Ғасеіабе1; 

save( 'Mat/trainData.mat', 'TrainData', 'trainLabel'); 


四 下 总 SJ 


for iPerson = 1:nPerson 
nSplPerClass(iPerson) = sum( (trainLabel == iPerson 


) ); 


end 


multiSVMStruct = multiSVMTrain(TrainData, nSplPerClass, 
nPerson, C, gamma); 


display(' 正在 保存 训练 本 
save(' Mat/multiSVMTrain.mat' ， 'multiSVMStruct'); 


вй сә yC КҮЛҮ ЛГ Г Г Г Т Т ССГ D 
display (' 训练 结束 。'); 


训练 结束 后 ， 训 练 结 示 和 参数 等 相关 信息 都 会 


Н 5ЛаА“Ма?” LIFE FJ S .mat 数 据 文 件 ， 以 
ЖҮЛ АЛП 18 Н. 


2. 识别 
识别 十指 对 未 入 的 号 份 进行 识别 ， 即 分 天 一 个 
等 定 样 


自 先 在 图 16.16 所 示 的 程序 主 寞 而 中 单 击 “ 打 
开 ” 按 钮 ， 触 发 GUIOpenFaceImage 过 程 ， 在 弹出 
的 “打开 文件 ”对 话 杠 中选 定 每 识 列 者 的 图 像 后 (这 
里 是 第 18 个 人 的 第 8 幅 图 像 〉》， 打 开 的 图 像 如 图 
16.17 所 示 。 


单 击 “ 识 别 ? 控 钮 ， 此 时 会 调用 过 程 
GUIRecgFaceImage, 1711 р %саѕѕіғу(). WRJ 
ZH K 416.185тлх, A| НУ ARA BJ ЛН 
Т ЧИ, АЛ А ЕНН ЛАЯ. 
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416.17 打开 每 识别 者 面部 图 像 


Figure 1: F#CTFHPCATNSYER:J À REME 
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416.18 ЖИЕН ЯИМ] 
RAP k ИЧ ДЕЛШ РЕ ЖООШ F o 


(1) GUIOpenFaceImage 过 程 





% GUIOpenFaceImage .m 
global filepath; 
[filename, pathname] = uigetfile(í'*.pgm;*.jpg;*tif', ' 
(*.pgm), (*.jpg), (*.tif)'; 
'*,ж*', "А11 Files(*.*)' }, 'Select a face image to 
be recognized'); 
1f filename ~ =0 


filepath = [pathname,filename]; 
ахеѕ(һ ахеѕ1); 
imshow(imread(filepath)); 


end 





(2) GUIOpenRecgImage 过 程 


% GUIRecgFaceImage.m 

nClass = classify(filepath); 

msgbox( [' FEJ] :',num2str(nClass)] ); 
axes(h_axes2); 


f = imread(['Data/ORL/S',num2str(nClass),'/1.pgm']); % 
打开 该 人 的 第 1 幅 图 像 


imshow(f); 





(3) classify( )рА Ж 


% classify.m 

function nClass = classify(newFacePath) 
% 整个 分 类 《识别 ) 过 程 

% 输入 : --newFacePath: 待 识别 图 像 的 存 取 路 径 
% Ж: --nClass: 识别 出 的 类 别 标号 


display(' '); 
display(' '); 
display(' 识别 开始 ...'); 


% ЗЕ ЛАНИ 
display(' 载 入 训练 参数 ...'); 
load('Mat/PCA.mat'); 
load('Mat/scaling.mat'); 


load('Mat/trainData.mat'); 
1оаа( 'Mat/multiSVMTrain.mat'); 
dic Dla sooo ereenn Ў 


xNewFace = ReadAFace(newFacePath); % 读 入 一 个 测试 样本 


xNewFace = double(xNewFace); 
xNewFace = (xNewFace-meanVec)*V; % 经 过 pca 变 换 降 维 
xNewFace = scaling(xNewFace,1,A0,B0); 


display( "号 份 识 别 中 . .. )) 
nClass = multiSVMClassify(xNewFace); 


display ooo ne oo a aaa 05 
display ([' ZMR AR, ŠJ]: ' num2str(nClass), '. ']); 


З. 测试 


测试 是 指 分 类 所 有 的 测试 样本 (40 个 人 的 后 5 
张 图 像 ， 共 200 个 样本 ) ， 并 计算 识别 深 。 在 如 图 
16.16 所 示 的 程序 主 界 面 中 蛙 击 “测试 ”按钮 ， 将 触 友 
testO 图 数 ， 运 行情 况 如 多 16.19 所 示 。 


结 采 显示 对 于 训 试 集合 的 200 个 全 新 样本 ， 
SVM 取 得 了 81.5% 的 识别 正人 确认。 考虑 到 数据 集中 
的 可 、 后 5 张 图 片 之 间 和 存在 一 定 的 姿态 、 表 情 等 因 
系 的 卉 寞 ， 这 样 的 识别 训 是 完全 可 以 接受 的 。 要 进 
一 步 提 高 识别 鞭 ， 可 以 从 两 个 方面 看 手 : 一 是 选取 
更 具 区 分 能 力 (Most Discriminative ) ВЕ, ZÆ 
ПД KTERE -o 


HT БУЕ НИ Н Y SA НУ 258 C 和 
gamma， 首 先 想 到 采用 16.4.3 小 节 中 得 到 的 最 优 参 
数理 狐 训练 ， 以 改进 多 类 SVM 分 类 上 右 。 设 置 C 为 
128，gamma 为 0.0078125， 如 图 16.20 所 示 。 


二 上 NATLAB 
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416.19 ”测试 结 


-) Figure 1: 3E-TPCATHSVEWJ A E 15428 K 
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图 16.20 ”重新 训练 C= 128, gamma = 0.0078125 


早 击 “训练 ”按钮 ， 香 新 训练 分 类 右 ， 结 果 如 图 
16.21 所 示 。 
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416.21 采用 优化 参数 训练 后 的 测试 结果 (85%) C = 128, 
gamma = 0.0078125 


a UEF ЕТНА 285%, к НН) 
81.5%， 这 样 束 从 实验 角度 证 明了 参数 优化 对 提 融 
分 关 货 推广 能 力 的 作用 。 


通过 选取 更 具 区 分 能 力 的 特征 来 提高 识别 率 是 
一 个 更 为 复杂 的 话题 ， 第 13 章 中 曾 多 次 强调 过 所 选 
择 的 特征 对 于 分 类 的 决定 作用 。 束 本 市 的 人 上 脸 识 别 
系统 而 言 ， 可 以 在 PCA 处 理 时 尝试 不 同 的 维 数 ， 观 
宪 特 征 维 数 对 于 识别 识 的 影响， 当然 也 会 存在 一 个 





所 谓 的 了 最 佳 维 数 ; УК, #13.5%irBJr28LBP#F4FE 
时 曾 指 出 了 LBP 特 征用 于 人 脸 识 列 问 题 的 优越 性 ， 
现在 可 以 从 实验 的 角度 来 知 穴 其 效果。 这 些 任 务 丈 
留 给 有 兴趣 的 谈 者 。 


MAP A ҢУЈсеѕі() РА УЗЕ К, Е 
程 目录 下 的 testm 文 件 中 。 


function test() 

% 测试 对 于 整个 测试 集 的 识别 率 
% 
% 输出 : accuracy --- 对 于 测试 集合 的 识别 率 


display(' '); 
display(' '); 
Д15р1ау('ЙАЯЕН...'); 


nFacesPerPerson = 5; 

nPerson = 40; 

рТеѕ+ = 1; 

% 读 入 测试 集合 

display( ' 谈 入 测试 集合 ..。.); 
[imgRow,imgCol,TestFace,testLabel] = ReadFaces(nFacesPe 
rPerson, nPerson, bTest); 
四 D 


% 读 入 相关 训练 结 

display(' 载 入 训练 参数 ...'); 
load('Mat/PCA.mat'); 
load('Mat/scaling.mat'); 
load('Mat/trainData.mat'); 
1оаа( 'Mat/multiSVMTrain.mat'); 


Bin: ol eh A et Tm “у 


% PCA 降 维 

display('PCA 降 维 处 理 ...'"); 

[m n] = size(TestFace); 

TestFace = (TestFace-repmat(meanVec, m, 1))*V; % 经 过 pc 
a 变 换 降 维 

TestFace = scaling(TestFace,1,A0,B0); 
四 “у 


% 多 类 SVM 分 类 

display( ' 测 试 集 识别 中 .. . ); 

classes = multiSVMClassify(TestFace); 
Пр ау ( sade ee ed pus ЕЕ ката кай кре mus '); 


% 计算 识别 率 

nError = sum(classes <= testLabel); 

accuracy = 1 - nError/length(testLabel); 

display([' 对 于 测试 集 288@ 个 人 上 脸 样本 的 识别 认为 '"，num2str(accu 
racy*100), '%']); 


165 ”SVM 在 线 资源 
作为 本 章 的 最 后 一 节 ， 下 面 介 绍 两 个 非 稼 优秀 
的 SVM 在 线 资 源 供 谈 者 学 习 和 和 研究， 在 今后 的 工程 
实践 中 也 可 以 十 分 方便 地 使 用 它们 。 
16.5.1 MATLAB 的 SVM 工具 箱 
互联 网 上 可 以 搜索 到 很 多 优秀 MATLAB 的 


SVM 工具 箱 ， 本 书 为 谈 者 推 存 一 个 由 Steve Gunn 
(srg@ecs.soton.ac.uk ) 编 与 的 SVM 工具 箱 ， 它 实现 
的 功能 相对 集中 《 文 持 分 类 和 回归 ) ， 人 代码 简洁 明 
了 ， 给 出 了 之 前 介绍 的 C-SVM 的 标准 实现 ， 二 次 规 
划 由 一 个 库 qp.dll 完 成 ， 非 党 适合 于 氏 学 者 理解 和 
Aje, MELLE EPAR. LR E RAAT 
系数 C 进行 设置 读者 还 可 在 最 大 分 类 间 隅 与 最 小 化 
训练 错误 代价 之 间 做 出 权衡。 





y — 


通过 MATLAB 编 写 的 SVM 程序 训练 一 个 大 样本 集合 可 能 导致 图 数 
运行 绥 慢 并 需要 大 量 的 内 存 。 如 果 在 此 过 程 中 提示 内 人 存 不 足 或 者 优化 
过 程 需 要 太 多 的 时 间 ， 请 尝试 分 割 为 小 一 些 的 样本 集合 并 使 用 交叉 验 
证 的 方法 来 测试 分 类 器 性 能 。 


16.5.2 LibSVM 的 简介 


LibSVMÆ RAKIRI (Chih-Jen Lin) 博 
EEFT a TREH WERA 
效 的 通用 SVM 软件 包 ， 可 以 解决 多 种 SVM 的 相关 
分 类 ， 当 然 其 中 也 包括 读者 之 前 讨论 的 C-SYVM。 所 
供 了 线性 、 多 项 式 、 径 同 基 和 Sigmoid 四 种 第 用 的 
核 水 数 供 选择 ， 采 用 基于 一 对 一 的 投票 策略 解决 多 
类 问题 ， 此 外 还 提供 了 通过 交叉 验证 日 动 选择 最 住 
参数 的 实用 功能 〈16.4.5 小 节 ) 以 及 对 不 平衡 样本 
加 权 和 多 类 问题 的 概 这 估计 等 。 


LibSVM 有 十 一 个 开源 的 软件 包 ， 需 要 者 都 可 以 
免费 地 从 作者 的 个 人 主页 http:/www.csie.ntu.edu.twy/ 
~cjlin/ 处 获得 。 它 不 仅 提 供 了 LibSVM 的 C++ 语言 
的 算法 源 代 但 ， 还 提供 了 Python、Java、 有 R、 
MATLAB、Perl、Ruby、LabVIEW 以 及 C#.net 等 
种 语言 的 接口 ， 可 以 方便 地 在 Windows UNIX `F 
台 下 使 用 。 此 外 ， 软 件 包 中 还 提供 了 Windows 平台 
下 的 可 视 化 操作 工具 SVM-toy， 在 进行 模型 参数 选 
择 时 可 以 绘制 出 交叉 验证 精度 的 等 高 线 图 。 


LibSVM 是 以 源 代 码 和 可 执行 文件 两 种 方式 给 
出 的 。 如 果 是 windows 系 列 操作 系统 ， 可 以 直接 使 
用 软件 包 提 供 的 程序 ， 也 可 以 进行 修改 编译 ;如 果 
征 Unix 关 系统 ， 则 必须 目 行 编 详 。LIBSVM 在 给 出 
源 代码 的 同时 还 提供 了 Windows 操 作 系 统 下 的 可 执 
行文 件 ， 包 括 进 行文 持 回 量 机 训练 的 Svmtrain.exe， 
根据 已 获得 的 支持 问 量 机 模型 对 数据 集 进行 预测 的 
svmpredict.exe， 以 及 对 训练 数据 与 测试 数据 进行 规 
格 化 操作 的 sSvmscale.exe。 它 们 都 可 以 直接 在 DOS 
环境 中 使 用 。 


下 载 附 向 的 帮助 文件 中 有 LibSYM 的 评 细 使 用 
方法 并 配 有 使 用 示例 ， 相 应 的 pdf 文档 中 还 给 出 了 
使 用 LibSVM 的 框架 [13,14]， 其 实 这 也 是 利用 SVM 
解雇 实际 问题 的 一 个 通用 框架 。 在 16.4 亲 本 书 正 是 
计 循 这 一 框架 来 解决 问题 的 。. 


2517272 дааВооѕі 


AdaBoost 85 >J Е ЗЕ) ПЕТ 

类 算法 ， 已 极 广 泛 应 用 于 人 脸 检 测 和 图 像 检 索 等 应 
HR., REZSI, BRAA S HTAA RMR 
IED. П, ERRA 26 m A H 
AdaBoot 5%] RJE, Z J ju] HJ #СаһЬог Il 
镜像 进行 贤 选 。 
本 草 的 知识 和 拷 术 热点 

(1) AdaBoost 分 类 思想 

(2) AdaBoost 理 论 基础 

(3) AdaBoostHFHJMATLAB 实 现 
本 草 的 典型 案例 分 析 


基于 AdaBoost 的 面部 图 像 男 女性 别 分 类 


17.1 AdaBoost; 2 #H 


АааВооѕі ЖК), НАН E ET XÍ 
[Н] АУ 18) Н) Сул) , Ж 


JU & Улт ШЖ, ЖУБУ T SE ШЙ) Z< 
TRR CETRA) 。 也 天 是 说 如 条 一 种 东西 用 一 
个 特征 分 不 开 ， 那 可 以 多 找 几 个 特征 ， 把 这 几 个 特 
征 组 合 起 来 束 可 以 得 到 逐渐 增强 的 分 类 此 。 既 然 特 
征 能 将 证 者 感 兴 趣 的 物体 和 其 他 对 象 分 辨 出 来 ， 那 
如 lc JHE? AdaBoost 束 提供 了 一 种 很 好 的 组 
织 方法 。 


1. AdaBoost 算 法 的 提出 背景 


在 机 右 学 习 领 域 ， 最 早 提出 的 较为 经 典 的 
Boosting 算 法 是 一 种 通用 的 学 习 算 法 ， 这 一 算法 可 
以 提升 任意 给 定 的 学 习 算 法 的 性 能 。 其 思想 源 于 
1984 年 Valiant 提 出 的 “可 能 近似 正确 ”(Probably 
Approximately Correct, РАС) 学 习 模 型 ， 在 PAC 析 
型 中 定义 了 两 个 概念 : IRE 2] ЯХИЯ 2] YE o 
其 概念 是 ;如 条 一 个 学 习 算 法 通过 学 习 一 组 样本 ， 
WIKI Ro MERRNI RIA; WRR KA 
EBELE WMI mo ДК У 59 2J IE 


1989 年 ，Kearns 和 Valiant 人 研究 了 PAC 学 习 模 型 

中 弱 学 习 算 法 和 强 学 习 算 法 两 者 之 间 的 等 价 问题 ， 
即 任意 给 定 仅 仅 比 随机 猜测 稍 好 〈 谁 确 鞭 大 于 0.5 ) 
的 屁 学 习 算 法 ， 是 从 可 以 提升 为 强 学 习 算 法 ? 厂 两 
和 寺 价 ， 则 只 和 需 寻找 一 个 比 随机 猜测 稍 好 的 弱 学 习 
算法 ， 然 后 将 其 升 为 强 和 学 习 算 法 ， 从 而 不 必 花 大 力 


А5 892590842] 95. АЈ, Schapire F 
199091258 / REWER. ДЕКОВЕ АХ 
A: 12—95 2] 95 а] РНЕ 1] Е 
正确 浴 的 强 学 习 算 法 ， 并 通过 构造 一 种 多 项 式 级 的 
宽 法 来 实现 这 一 加 强 过 程 。 这 就 是 最 彻 的 Boosting 
算法 的 原型 。Freund 于 1991 年 提出 了 另外 一 种 效率 
更 局 的 Boosting 算 法 。 但 此 算法 需要 提前 知道 弦 学 
习 算 法 正确 率 的 下 限 ， 因 而 应 用 范围 十 分 有 限 。 


Freund 和 Schapire 于 1995 年 改进 了 Boosting 算 

法 ， 取 名 为 AdaBoost 算 法 。 该 算法 不 需要 提前 知道 
所 有 天 于 鸡 学 习 算 法 的 匈 验 知识 ， 同 时 运算 效率 比 
t o AdaBoost}} Adaptive Boosting, ‘€ fé H EM 
ДИ АЖЕ УУЛ 2] RAWE RE, AALA TARANTE R 
х ВЕЈА 2ДАН НСИ AN, EA r Fa RN 
ЛАВЕ Д2 [ЇН] 27 1Н, ERRI TA Ja ИЛЕР А л [н] 07 
їй, ТТ ИТКЕ KJE, JERAT ЇН] H 48 E 
全 分 估 的 样本 权重 降低 ， 航 销 误 分 闫 的 样本 权重 控 
mo XE PARI 27ТАЙ ВЕ E KIE Н рн т AR 
IER. EA RA 2 Hi Н 1] у ini, 
因此 已 经 成 为 最 流行 的 Boosting 算 法 。 


AdaBoost 算 法 是 Ferund 和 Schapire 根 据 在 线 分 
配 算法 提出 的 ， 他 们 详细 地 分 析 了 AdaBoost 算 法 错 
REEF, UKN Г ол акл Јн А НОЈ 
Ж, Ятт ЗЕ) ы АКО ААН Э АЈА, 5 


Boosting 算 法 不 同 的 是 ，AdaBoost 算 法 不 需要 预 气 
ЖИЛЕ JI F >J SL: 2] ТЕЁ) F IK E] 35 2725 H'J VA 
ZÉ, ЕН a S ЕНШ p ЧУКА Ho J PT 
有 弱 分 类 带 的 分 类 糊 度 ， 这 样 可 以 深入 挖掘 绚 分 类 
ALIA I RE 


2. AdaBoost 算 法 的 分 类 模型 


随机 猜测 一 个 回答 是 或 售 的 问题 ， 都 会 有 50946 
的 正确 率 。 如 来 一 个 假设 能 够 和 做 地 近 融 猜 击 正确 
的 概率 ， 那 么 这 个 假设 吏 是 能 学 习 算 法 ， 得 到 这 个 
算法 的 过 程 称 为 弱 学 习 。 可 以 使 用 半 目 动 化 的 方法 
为 好 儿 个 任务 构造 弦 学 习 算 法 ， 构 造 过 程 需 要 数 量 
巨大 的 假 放 集合 ， 这 个 假设 集合 征 基于 东 些 侧 单 规 
则 的 组 合 和 对 样本 集 的 性 能 评 信 和 而 生成 的 。 如 果 一 
个 假说 能 够 巡 者 地 皖 噩 猜测 正确 的 概率 ， 那 么 这 个 
假设 就 称 为 强 学 习 。 


在 前 面 的 第 16 间 中， 我 们 了 解 了 文 持 问 量 机 的 
分 类 模型 ， 对 于 图 16.1 所 示 的 分 类 样本 ， 为 了 避 免 
曲线 模型 对 样本 的 过 度 拟 合 ， 将 分 其 模 型 简单 化 ， 
选择 了 下 线 分 类 模型 。 事 实 上 ，AdaBoost 算 法 采用 
的 分 类 模型 更 向 单 ， 它 只 是 选取 比 随机 猜测 稍 好 的 
分 闫 模型 ， 只 是 需要 经 过 多 次 训练 ， 从 而 得 到 较 好 
的 分 类 结果 。 


AdaBoost& МЈ ИЛЕ, ДЛ WL AH E £T XJ 
|а] МАКЕТА] АЈ GIR ， 然 
Л 9 a E r Е, МЈ ЛХ i о ҢЈ 26 
TRA Сол). НАА НЕНА Ts 
分 布 来 实现 的 ， 它 根据 每 次 训练 集 之 中 每 个 样本 的 
TREERE, UR ERHET, H 
确定 每 个 样本 的 权 值 。 将 修改 过 权 值 的 狐 数 据 集运 
给 下 层 分 类 帮 进 行 训 练 ， 最 后 将 每 次 训练 得 到 的 分 
类 酉 最 后 融合 起 来 ， 作 为 最 后 的 强 分 类 右 。 合 用 
AdaBoost 分 类 妖 可 以 排除 一 些 不 必要 的 训练 数据 特 
体 ， 并 将 重点 放 在 关键 数据 的 训练 上 面 ， 因 此 
AdaBoost 算 法 也 是 特征 选择 和 特征 加 权 的 有 利 工 
E. 


=> ` 9 


3，AdaBoost 算 法 流程 


AdaBoost 算 法 针对 不 同 的 训 纤 集训 练 同 一 个 基 
本 分 类 器 ( 弱 分 类 器 〉， 人 然后 把 这 些 在 不 同 训 练 集 
上 得 到 的 分 茯 豆 集合 起 来 ， 构 成 一 个 更 强 的 最 终 的 
分 类 器 〈 强 分 类 器 ) 。 理 论证 明 ， 只 要 每 个 弱 分 类 
ATARE JI ENLA M, SETAE FEA 
ЛЕТ, эңе ЧЕН 4а [ај Ж HA 
程 图 如 图 17.1 所 示 。 


开始 
1: 归 一 化 权重 


А: 给 定 一 系列 训练 
样本 


预定 义 过 程 : D2，D3 


2. 计 算 每 个 特征 值 的 
弱 分 类 器 的 加 权 错 
误 率 


3. 选 返 最 小 销 误 率 的 
3927248 





Pam 4. 调 整 权 重 


图 17.1 AdaBoost 算 法 流程 图 


17.2 AdaBoost 理 论 基 础 


在 未 绎 机 豆 和 学习 问 题 中 ， 往 往 肥 现 正 确 的 经 验 
舍 计 比较 容 多 ， 而 及 现 单 个 非常 准确 的 预 负 比较 团 
难 。 因 此 通 种 采用 这 样 的 算法 : 选择 一 个 较 小 的 训 
练 尾 本 于 集合， 获得 近似 鸭 经 验 估计 ; 选择 第 二 个 
较 小 的 训练 样本 于 集合 ， 获 得 第 二 个 经 验 估 计 ; E 
R АЖК. 


在 这 个 过 程 中 ， 存 在 两 个 不 可 避免 的 问题 : С) 
在 每 次 重复 中 如 何 选择 训练 样本 于 集合 ? 凶 如 何 将 
右 干 个 经 验 估计 转换 成 单个 预测 规则 ? 


Boosting 算 法 是 将 奋 干 近似 经 验 佑 计 转 斤 成 高 
度 准 确 的 了 预测 规则 的 一 般 物 法 。 从 模式 分 类 角 友 上 
看 ， 是 把 厂 干 个 “ 弱 ” 分 类 桥 组 合成 “ 强 ” 分 类 桥 有 的 算 
法 。 也 束 是 说 ， 在 学 习 概 念 时 ， 只 要 找到 比 随 机 猜 
测 略 好 的 弱 学 习 算 法 ， 束 可 以 将 其 提升 为 中 学 习 算 
法 ， 而 不 必 和 朋 接 去 寻找 通常 情况 下 很 难 获得 的 强 学 
习 算 法 。 和 下面 丁 从 要 介绍 一 下 Boosting 算 法 的 训 


(1) 给 定 弱 分 类 如 和 训练 集 


X = (21,30), (z202), (тазза), (а) {rlrie x) 表示 训练 样本 集 
r ЕЯ JE, 其 中 ， 样本 x; 对 应 的 类 
别 标号 为 xsY={+l -1 ， 此 时 表示 二 值 分 类 问题 ， 是 
多 其 问题 的 扩展 ， +] 表 示 正 例 ，-1 表 示 反 例 。 


(2) 初始化， 训练 集 初 始 分 布 为 Jm ， 每 个 训 
练 例 的 权重 为 Im 。 


(3) 调用 弱 分 类 器 ， 对 训练 集 进行 训练 ， 得 


(4) 经 过 T WK pe ВЕХИ к 
率 更 新 训练 集权 重 ， ЕН ТАИ РР А 
权重 ， 此 后 按照 新 的 分 布 进 行 训练 ; 从 而 得 到 新 的 
假设 序列 hj ,ho ...h, o 


(5) 经 过 种 权重 的 投票 方式 最 终 得 到 一 个 假 
WH, 。 带 权重 的 投票 方式 可 以 目 动 调整 五 的 精确 
E, AETR E T AARAA 
JH, B44 ЖИ AI P R ЦЕ Ta 28 SM FF EIR ç 


AdaBoost (Adaptive Boosting) 作为 Boosting 算 
法 的 改进 版 本 ， 在 效率 上 同 传统 Boosting 亿 法 几乎 
HE, 1E m HARFI EA НУСУ, 
而 更 容易 应 用 到 实际 问题 当中 。 下 面 束 古 AdaBoost 
算法 的 形式 化 拍 述 


给 定 训 练 集 : [z 34), (rN Ум), 其 中 є{1,—1}, 22 
示 zi 的 正确 的 类 别 标签 ，;=1…:x 。 训 练 集 上 样本 的 
Жн: 


КЕ 1 
A = = 


(17-1) 


对 ,=1…:7， 在 分 布 寻找 Di L 4k НОН в/н 
RRITAR oL, HR, EINTR 
ТАН Di КЕ MERN : 


= = Рр, (А (zi) Z Yi) 





(17-2) 
计算 该 弱 分 类 器 的 权重 系数 
а = ;I 6 | 

(17-3) 


更 狐 训 练 样本 的 分 布 : 


D; (i) exp (—oryih (2;)) 


| : Ж, 


(17-4) 


ДР, а 为 归 一 化 常数 ， 
最 后 的 强 分 类 器 为 : 
Haaa (2) = sign [> athi a) 
(17-5) 
URAT 
记 a=}-m， 由 于 弱 分 类 器 的 错误 率 总 是 比 随机 


育 测 小 《随机 猜测 的 分 类 桥 的 针 误 率 为 0.5) ， 所 以 


0.12% >20, Јл (ны) < T, WH Y ATI 
练 轮 数 T JP J, Ик E rd 4 Bras o 


iM- 


Rr (Henal | <. сехр (= 


(17-6) 


下 面 的 例 17.1 说 明了 AdaBoost 算 法 的 计算 过 


各 


【 例 17.1】 一 个 两 医 样 本 的 AdaBoost 学 习 过 
程 ， 样 本 分 布 如 图 17.2 所 示 。 


17.29, “+”ЯП“-”2) 5л РА ТЭ], ТЕХ 
MIF, HSH kak ЖЕН ПУН 2% GINA 
йт) ТЕЛ, REITIR. 


第 一 轮 : 在 本 轮 中 样本 分 布 D1 = [0.1 0.1 0.1 
0.1 0.1 0.1 0.1 0.1 0.1 0.1]， 能 够 最 好 分 开 两 类 样本 
(最 小 化 训练 错误 ) 的 弱 分 类 妖 h 1 是 如 图 17.3 所 示 
的 一 条 竖 特 分 割 线 ， 其 中 划 圈 的 样本 表示 被 分 销 
的 。 通 过 适当 加 天极 销 分 样本 的 权重 ， 得 到 一 个 新 
的 样本 分 布 D，( 图 17.4， 其 中 比较 大 的 “+” 表 示 对 
该 样本 做 了 加 权 ) o 





4172 ”样本 分 布 图 
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4174 D > 新 样本 分 布 


经 本 轮 弱 分 闫 硕 分 类 RET 
分 类 错误 率 4 5у3/10=0.3, ША Ж = ia 
0.42, 


第 二 轮 : 同样 选择 能 够 最 小 化 分 类 错误 的 能 分 


类 器 ， 这 里 变 成 了 图 17.5 中 所 示 的 竖 线 hn 。。 可 以 看 
到 ， 由 于 第 一 轮 中 错 分 的 3 个 样本 权重 得 到 了 增 
加 ， 本 轮 迭 代 中 它们 全 部 被 正确 分 类 。 经 过 本 轮 得 
到 一 个 新 的 如 图 17.6 所 示 的 样本 分 布 D 3 ， 其 中 又 增 
加 了 本 轮 错 分 样本 的 权重 ， 被 正确 分 类 样本 的 分 布 
则 相对 减 小 。 





417.5 59977246 о 





图 17.6 ”新 样本 分 布 D 3 


和 直观 上 看 ， 第 二 轮 中 错 分 的 样本 数目 仍然 为 3 
个 ， 但 由 于 本 轮 各 个 样本 不 再 是 平均 分 布 ， 在 第 一 
轮 中 被 错 分 的 样本 权重 变 为 0.1xexp(a 1 )=0.1522, 
而 分 对 的 样本 权重 变 为 0.1xexp(-a 1 )=0.0657， 归 一 
化 系数 Z, =3x0.1522+7x0.0657=0.9165， 因 此 在 本 轮 


样本 分 布 D， 上 的 分 类 错误 率 s 
=0.0657/0.9165x3=0.21 (第 二 轮 错 分 的 3 个 样本 分 布 
М8 2) 70.0657) ， 根 据 式 “17-3) 计算 出 a o 
=0.65。 


第 三 轮 : 同 前 2 轮 ， 得 到 一 个 弱 分 类 融 h 3 ， 如 
图 17.7 所 示 ， 用 同 第 二 轮 的 方法 计算 出 e =0.14, а: 
=0.92。 


最 后 ， 依 据 3 轮 训练 得 到 的 加 权 系 数 ， 整 合 所 
Ву у зщ? ЭЁ, ИП 17.8ТЛ, ТЕМ 
FEE RKR УН) Ж 6А 0 БТА ДУ АЛАУ # ZY ER 
大 ， 说 明 在 整合 过 程 中 倾 问 于 听取 那些 分 类 效果 更 
好 的 弱 分 类 器 的 意见 。 从 结果 看 ， 所 有 样本 都 被 正 
人 硝 划 分 ， 说 明 即 使 是 徐 单 的 弱 分 类 硕 ， 人 合理 整合 起 
来 也 能 获得 理想 的 分 类 效果 。 
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AdaBoost 算 法 具有 两 个 比较 好 的 特性 : 一 是 训 
ЭКН w L, ЕКИН ОЈ, < K F 
БЕ; е АааВооѕі Z= BB A АИНУ, 
Лун ДАУ БЕЙ НУ ali, 


qumi 


—sign 0.42 “[ | OE 





417.8 ZAMENA 
ТЕНГ ВУ ЖА НЕН, ум. 21] дааВооѕі 
IE T ЖЕ Н] URRATXA |н] д, DX — да 5) 5162 
介绍 的 SVM 算法 相似 。 因 此 ， 可 以 使 用 本 书 在 第 16 
章 中 介绍 的 几 种 策略 将 AdaBoost 推 广 到 多 类 问题 ， 
XESH. 


17.3 ”构建 AdaBoost 的 MATLAB 工 
HJK 


在 介绍 完 前 面 的 理论 知识 后 ， 这 节 重 点 讨论 
AdaBoostFJMATLAB 实 现 方 法 。 明 前 ，MATLAB 


H 市 工具 箱 中 疝 没 有 专门 编号 的 AdaBoost 算 法 的 相 
天 程序 。 本 和 ， 将 市 领 谈 者 一 起 构建 目 己 的 
AdaBoost 工 具 箱 。 


主要 男 数 的 构建 
了 解 了 AdaBoost 的 主要 思想 和 算法 流程 ， 下 面 


就 结合 17.2 节 介绍 的 AdaBoost 算 法 理论 来 给 出 
AdaBoost 工 具 箱 中 的 重要 函数 实现 。 旋 者 可 以 在 随 
书 附 赠 光 盘 的 “chapter17A\Code\Adaboost std 目录 下 
找到 AdaBoost 工 具 箱 的 实现 文件 。 


1. weakLearner() 8 2% 


BL H вА ОУУ ЖЕ J 27 ей, KHIR 


(1) 对 于 训练 样本 的 每 一 维特 征 ， 分 列 计算 
两 类 样本 在 该 维 上 的 均值 m 1 和 m 2. 


(2) 以 (m 1+т 2)/2 作 为 分 割 国 仁 ， 对 训练 样 
本 进行 分 类 ， 将 大 于 域 值 的 单元 所 对 应 的 样本 判定 
为 一 闫 并 将 其 分 类 标签 设 为 +1， 小 于 域 值 的 单元 所 
对 应 的 样本 判定 为 另 一 次 并 将 其 分 类 标 俭 设 为 -1。 
通过 将 前 面 得 到 的 分 类 标签 与 训练 集 回 有 的 标签 进 
行 比 较 ， 得 到 采用 该 维特 征 作 为 分 类 特征 时 的 识别 


(3) 重复 步骤 (1) 和 步骤 Q), RAAY 
RHA mE REREN ITRI RRE, 
以 采用 该 维特 征 时 得 到 的 识别 率 作 为 弱 分 类 器 的 识 
UES 


PK AHRI SKLU F o 


function WL = weakLearner(w, TrainData, label) 


% input: w - 加 权 后 的 样本 分 布 


% TrainData - 训练 样本 集 
% label - 训练 样本 的 类 标签 集 


% output: WL - 结构 体 ， 保 存 弱 分 类 右 同 量 相 关 信 息 
X WL. 


[m n] = size(TrainData); 


pInd 
nInd 


(label == 1); 
l == -1); 


for iFeature = 1:n 
pMean = pInd' * TrainData(:, iFeature) / sum(pInd) 


nMean = nInd' * TrainData(:, iFeature) / sum(nInd) 


thres(iFeature) = (pMean + nMean) / 2; % 取 两 个 类 样 
本 的 总 均值 作为 分 类 的 域 值 


nRes = TrainData(:, iFeature) >= thres(iFeature); 


pRes = TrainData(:, iFeature) < thres(iFeature); 
nRes -1 * nRes; 
res = pRes + nRes; 


error(iFeature) = w * ( label ~= res); 
end 


[val, ind] = max(abs(error-0.5)); 
if error(ind) > 0.5 


error(ind) = 1 - еггог(іпа); 
WL.direction = -1;% 将 此 次 划分 的 结果 取 反 作为 划分 的 
正确 结果 
else 
WL.direction = 1; 
end 
AER 35822 HJH RIE bi. 
WL.iFeature = ind;% 所 取 特 征 维 的 维 数 
WL.error = error(ind);% 该 假设 下 的 错误 率 
WL.thres = thres(ind);% 该 假设 所 取 的 域 值 


值得 注意 的 是 ， 最 小 的 错误 座 并 不 是 里 指 的 销 
误 座 的 实际 值 最 小 ， 而 是 取 错 误 众 与 0.5 的 过 的 绝对 
值 最 大 的 那个 错误 率 〈 即 实际 错误 率 最 小 或 最 大 ) 
作为 选取 有 条 维特 征 的 依据 。 当 这 样 找到 的 最 “小 ”的 
Н (ЗЕК Бле КЕН) 的 实际 值 大 于 0.5 
时 ， 则 将 变量 WL.direction 衣 为 -1， 用 以 表示 将 此 次 
ЖЛЕ? gg ла 吉 朵 。 这 是 因为 ， 
这 里 进行 的 只 是 A В 两 类 的 划分 ， 故 不 是 A 类 全 
В 类 ， 无 论 是 将 大 部 分 A 类 的 分 为 了 B 类 ， 又 或 


是 将 大 部 分 的 B 类 分 为 了 A 类 ， 仅 需 改变 分 类 之 后 
的 标签 即 可 得 到 正确 率 较 高 的 划分 结 


2. AdaBoost( K ži 


该 函数 为 训练 函数 。 在 该 函数 中 ， 首 先 利用 样 
本 和 标 侈 补 始 化 权重 癌 量 得 到 初始 分 布 w ， 让 两 基 各 
目 计 算 权 重 以 体 证 每 次 分 类 时 都 能 充分 地 考虑 到 关 
列 不 同 所 霹 成 的 影响 ， 人 耕 则 ， 石 一方 的 数量 过 多 ， 
则 可 能 由 于 样本 数目 的 不 同 使 得 伞 本 总 数 较 少 的 一 
方 难以 对 于 总 体 的 划分 产生 应 有 的 影 啊 。 


其 次， 通过 利用 充 函 数 中 经 过 的 了 识 和 欠 代 ， 参 
照 本 书 17.2 中 所 介绍 的 方法 ， 按 照 式 〈17-3) 计算 
29У 27 Этте Н) ЕН АЗИ, AIARA (17-4) 在 每 次 
АЛМ ЖЫЙ VZR Ж Ъ ТУЛИ НН, 2481677 
医 的 训练 例 赋予 较 大 权重 ， 然 后 按照 新 的 分 布 进行 
训练 ， 从 而 得 到 新 的 假 放 序列 CABoosted{1}， 
CABoosted{2},..CABoosted{i}.- 


经 过 市 权重 的 投票 方式 最 终 得 到 一 个 假设 
CABoosted 。 带 权重 的 投票 方式 可 以 目 动 调 
整 CABoosted 的 精确 性 ， 给 定 轮 分 类 器 的 前 所 下 ， 
随 痢 运 代 次 数 的 增加 ， 最 终 得 到 的 假设 的 错误 率 按 
HA ЕР ЛЕ EYR ° 


图 数 具 体 代 但 实现 如 下 。 


function CABoosted = adaBoost( TrainData, label, nIter 


) 

% Training : Rýrboostin ЖЕТЕЛ TA УУ”? 2S К” 
TRA 

% Input: 

% TrainData -训练 数据 

% label - 类 标签 

% nIter - IAEI BIJNAAM A 

pInd = find(label == 1); 


nInd = find(label == -1); 
nP = length(pInd); 
nN = length(nInd); 


м(рІпа) = 1 / (2 * nP); 
w(nInd) = 1 / (2 * nN); 
eps = 0.001; 


% @#ExFnIter/ In K rin, 2р - лш? 2S 8 
for iIt = 1:nIter 
% 归 一 化 w 


W = w / sum(w); 


WL = меакіеагпег (м, Тгаіпра+а, 1абе1) ; 352539160 
САВооѕеа{ ії}. с1аѕѕі+Ғіег = WL; 


Теаіпраёа(:, Мі .іҒеаёиге) >= WL.thres; 
Теаіпраёа(:, Мі .іҒеаёиге) < WL.thres; 


пКеѕ 
рКеѕ 


nRes = -1 * nRes; 
res = pRes + пКе<; 


1f WL.direction == -1 
res = -1 * pes; 
end 


alfa(iIt) = (1/2) * log( (1-WL.error) / (WL.error 
+ eps) ); % 计 算 加 权 系 数 
W = w .* exp( -alfa(iIt) * (label .* res) )'; Хт 


分 布 
CABoosted{iIt}.alfa = alfa(ilt); 
if WL.error < eps 
break; 
end 
end 


З. AdaBoostClassify () р 


IZ RANMA CTR) 函数 ， 它 通过 传 入 的 分 
类 器 相关 信息 CABoosted 〈 由 学 习 得 到 ) ， 实 现 将 
H TITR MIAA A T Ee E E” TARKA 
虚 准确 的 预测 ， 完 成 对 传 入 数据 集 Data 的 分 医 并 将 
27225 9) |а| 25 сјаѕѕ5ађе H. HEF, 5 1р4 
输出 sum де HRALI Ч 27 2S as ЛАУ “1% 

了 票 ” 绪 采 ， 可 以 作为 置信 上 度 信 息 使 用 ;而 sum 经 过 
Ке ла (17-5) H HJH final ° 


图 数 具体 代 但 实现 如 下 。 


function [classLabel, sum] = adaBoostClassify( Data, CA 
Boosted ) 
% Input: 


% Data - FNRA ЛЕ , FIT T FE 

% CABoosted - CellArray 类 型 ， 记 录 这 每 个 分 类 器 的 相关 信 
ЕН 

% Output: 

% classLabel - Data 的 类 标号 

% sum - 可 以 作为 分 类 置信 虚 信 和 县 


[m n] = size(Data ) ; 


sum = zeros(m, 1); 


nWL = length(CABoosted); 


for iWL = 1:nWL%/ZUH]BUIHLS#UBJ5927p2S363E4r 511, FRA E 
一 个 高 度 准 确 的 预测 

WL = CABoosted{iWL}.classifier; 

alfa = CABoosted{iWL}.alfa; 

nRes = Data(:, WL.iFeature) >= WL.thres; 

pRes = Data(:, WL.iFeature) < WL.thres; 

nRes = -1 * nRes; 

res = pRes + nRes; 


1f WL.direction == -1 
res = -1 * pes; 
end 


sum = sum + alfa * res;% 将 每 次 得 到 的 弱 分 类 的 近似 经 验 
估计 ， 通 过 综合 估计 转换 成 融 度 准确 的 预测 


end 


classLabel = -1* ones(m, 1); 
ind = find(sum >= 0); 


classLabel(ind) = 1; 








17.4 MATLAB S ZM 基于 
AdaBoost 的 面部 图 像 务 女性 列 分 类 


通过 前 面 对 于 AdaBoost 算 法 的 介绍 的 了 解 ， 想 
必 读 者 已 对 该 算法 有 J 了 和 初步 的 认识 。 本 廊 将 角 过 利 
用 AdaBoost 工 具 箱 实现 基于 AdaBoost 算 法 的 对 于 图 
像 的 性 别 识别 。 


17.4.1 关于 数据 集 
本 案例 所 用 数据 集 位 于 本 书 配套 光盘 中 


Chapter17/AdaboostGender Н >< F IjJfaces.mat X4} 
中 ， 使 用 load 命 令 加 载 后 如 图 17.9 所 示 。 


>> load faces. mat 


>> whos 
Name lze Bytes Class åttributes 
faces pl1x18750 7850000 double 
faces label Blix] 409 double 
new faces 21X18150 4050000 double 


new_label 2 x] 216 double 


417.9 faces.mat 数 据 集 
其 中 ，faces 和 new_faces 为 面部 图 像 数据 。 


facesE ЕНТ 7у аА УА 
示 ， 整 个 矩阵 共 包 含 51 个 维度 为 18750 (15047, 
125 列 ) 的 面部 图 像 ， 是 本 例 采 用 的 训练 数据 ; 
new_faces 中 包含 27 个 同样 维度 的 测试 用 面部 图 像 。 
可 以 使 用 Display_image() 函 数 将 图 像 原始 面部 图 像 
显示 出 来 ， 如 下 命令 显示 了 训练 集中 第 一 行 对 应 的 
图 像 ， 如 图 17.10 所 示 。 


Fle Edit View Inset Tools Desktop Window Help 


пашо а |4 09RA a nB am 
































417.10 ”第 一 行 对 应 的 图 像 


>> Display image(faces(1, :), 150, 125) 


faces label#lnew_ label 两 个 文件 分 别 为 训练 样 
本 币 试 样 本 的 类 标签 文件 ， 其 中 每 一 行 所 取 的 人 
代表 了 对 应 在 图 像 数 据 集 中 的 相同 行 吉 的 样本 所 具 
有 的 性 别 分 类 ， 其 中 ， 值 为 1 的 代表 女性 ， 值 为 -1 
的 代表 男性 。 


17.4.2 ”数据 的 预 处 理 


由 于 本 例 所 采用 的 Adaboost 弱 分 类 器 是 在 每 一 
个 维度 上 进行 二 分 ， 过 珊 的 维度 意味 看 过 多 的 界 分 
REMH, ХХК к. КЮ, НАЖ 
用 简单 的 重 采 样 技术 对 原始 数据 从 18750 维 降 维 到 
750 维 。 实 现 这 一 下 采样 的 preprocess.m 文 件 如 下 。 


load faces .mat 
faces_small = imresize(faces, [51, 750], 'bilinear'); 


new faces small = imresize(faces, [27, 750], 'bilinear' 


); 


save( 'Ғасеѕ small.mat', 'Ғасеѕ small', 'new_faces small 
', faces label', 'new_label'); 





174.3 Я ЙЕЗЕ 


在 前 面 介 绍 的 基础 上 ， 按 照 实验 的 整个 流程 分 
为 以 下 几 个 步 又 。 


(1) 读 入 训练 样本 和 确定 “ 弱 ” 分 类 带 有 的 个 
数 。 


谈 入 数据 集 文 件 faces_smallmat ,通过 参数 的 传 
递 硝 定 “ 弱 ”分 类 需 的 个 数 ， 默 认 什 为 500。 


(2) 1959728, FRIR Y. 


Ж] H17.3.1 LA FRAEN L EL HAH 
ууеаКТ еагпег() 2, ANEAN ZRII NT RHA 
1, MAERA ЛЕРА, 15110105516 
设 的 相关 信息 体 存 在 结构 体 WEL 中 并 返回 给 弱 假 议 
САВоовїеа{ї +. 


СЗ) 根据 前 面 得 到 的 能 假设 序列 ， 连 代 得 到 


假充。 


利用 17.3.1 小 节 中 学 过 的 函数 AdaBoost()， 根 据 
有 前面 得 到 的 弱 假 设 序 列 ， 计 算 加 权 系 数 及 新 的 分 布 
BLOK КОН HERNE 


(4) 根据 前 面 得 到 的 假设 ， 对 训练 样本 及 测 
试 样本 进行 分 类 识别 ， 最 终 得 到 一 个 " 强 * 分 类 器 的 
高 度 准确 的 预测 。 


调用 工具 箱 中 的 图 数 AdaBoostClassify О), 
退 过 前 面 得 到 的 假设 ， 完 后 对 训练 样本 及 测试 样本 
进行 分 类 识别 ， 并 返回 预测 分 类 的 最 终结 果 ， 通 过 
š 样本 原来 对 应 的 标 釜 进行 比较 计算 出 识别 的 铺 误 


上 述 算 法 流程 的 实现 家 封装 在 main.m 文 件 中 ， 
如 下 所 示 。 


function [errTrain, errTest] = main(nWL) 
% 输入 : nWL - 训练 迭代 的 轮 数 

% 输出 : errTrain - 训练 集 的 错误 率 

% errTest - А ЈН 


1оаа('Ғасеѕ ѕта11.та&'); 
1f nargin == 
nWL = 500; 


end 
% 训练 过 程 
CABoosted = adaBoost( faces small, faces label, nWL ); 


% 对 于 训练 样本 

classLabel = adaBoostClassify( faces small, CABoosted ) 
errTrain = sum(classLabel ~= faces label) / length(face 
s label); 


clear classLabel 

% 对 于 测试 样本 

classLabel = adaBoostClassify( new Ғасеѕ small, CABoost 
ed ); 

errTest = sum(classLabel ~= new_label) / length(new_lab 
el); 





ТЕМАТГАВя 5417 71811 Н таіп() р 5, SAA 
迭代 500 轮 后 ， 得 到 的 训练 样本 识别 错误 率 为 0， 
测试 样本 为 18.59%6。 





> [errTrain, errTest] = main 
errTrain = 
2 


errTest = 
0.1852 


A | 8 Ze SEJJI / 6 Г Ааарооѕ YAM] 
ШИ Ж ЕЈ), ХА Е ДЕ ВИ] Ж МИ АХ 
WER, эри] РД ДУ УУ 7 НЗС 2775 РА K ПА] 
将 弱 分 类 结果 更 好 地 综合 成 “ 强 分 类 ”等 方面 开展 下 
一 步 的 研究 。 而 事实 上 ， 构 建 适合 于 具体 问题 的 弱 
分 类 器 正 是 Adaboost 技 术 应 用 的 关键 。 


参考 文献 


[1] [IK E E, 数字 图 像 处 理 . 
жт и ea оо. 
2003. 


[2] [EDAS E. 模式 分 类 . FERR, F 
ВЕ. 北京 : 机 械 工 业 出 版 社 ，2003. 


[3] POR, 4AT, 2. Visual C++ 数字 图 像 
处 理 . 第 二 版 . 北京 : 人 民 邮 电 出 版 社 ，2002. 


[4] WRH, Ja. Visual C++/Matlab 图 像 处 
理 与 识别 实用 案例 精 选 . 北京 : 人 民 邮 电 出 版 社 ， 
2004. 


[5] ЕЕ, 92. Windows 程 序 设计 . 
第 二 版 . 北京 : 人 民 邮 电 出 版 社 ，2008. 


[6] AT&T Laboratories Cambridge.ORL Face 
database|DB/OFL | . 
http://www.cl.cam.ac.uk/research/dtg/attarchive/facedat 


[7] A Timo, H Abdenour, P Matti, “Face 
description with Local Binary Patterns: Application to 


Face Recognition”, IEEE Transactions on Pattern 
Analysis and Machine Intelligence, Vol28, 2006.12. 


[8] 张 锋 , 赵 政 等 。Expression Recognition 
Based on Multi-scale Block Local Gabor Binary 
Patterns with Dichotomy Dependant Weights, 
opringer’s LNCS 5553, 2009. 


[9] КЕ, 赵 政 等 ， 基于 二 维 MB-LGBP 特 征 
的 表情 识别 .计算 机 应 用 ，2009. 


[10] ERI, RER. 采用 PCA / ICA 特 征 和 
SVM 分 类 的 人 上 脸 识 别 . 计算 机 辅助 设计 与 图 形 学 学 
报 . 2003.15(4):416-420. 


[11] 56%, ANJ, Æ. Зр Representative 
Face and Clustering Based Illumination Estimation for 
Expression Recognition, Springer s LNCS 5553, 
2009. 


[12] 3K. 基于 三 维特 征 脸 模型 的 光照 参数 
估计 .大 视野 期 刊 . 湖南 : 人 民 出 版 社 ，2008. 


|13] Chih-Wei Hsu, Chih-Chung Chang, and 
Chih-Jen Lin. A Practical Guide to Support Vector 
Classification.Department of Computer Science 
National Taiwan University, Taipei 106, Taiwan.http:// 


www.csie.ntu.edu.tw/~cjlin.Last updated: December 
20, 2007. 


| 14 | Chih-Chung Chang and Chih-Jen Lin. 
LIBSVM: a Library for Support Vector Machines.Last 
updated: June 14, 2007. 
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异步 社区 的 来 历 


异步 社区 (www.epubit.com.cm 是 人 民 邮 电 出 版 
社 旗下 IT 专业 图 书 旗舰 社区 ， 于 2015 年 8 月 上 线 运 


异步 社区 依托 于 人 民 邮 电 出 版 社 20 余 年 的 开 专 
业 优 质 出 版 资源 和 编辑 策划 团队 ， 打 造 传统 出 版 与 
电子 出 版 和 自 出 版 结合 、 纸 质 书 与 电子 书 结合 、 传 
统 印 刷 与 POD 按 需 印 刷 结 合 的 出 版 平台 ， 提 供 最 新 
技术 资讯 ， 为 作者 和 读者 打造 交流 互动 的 平 合 。 
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社区 里 都 有 什么 ? 


JJ 5Е s] 4 


我 们 出 版 的 图 书 涵盖 主流 I 技术 ， 在 编程 语 
Web 技 术 、 数 据 科 学 等 领域 有 众多 经 典 畅 销 网 
。 社 区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 400 多 
种 ， 部 分 新 书 实 现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 


ЕЩ 


会 定期 友 布 新 书 书 讯 。 
F 27 


Хх Ру ERREP ЛЕП, д F НУ я] 
АЛИИ. 


另外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 
注册 成 为 社区 用 户 就 可 以 免费 下 载 。 
JEE H) 


很 多 图 书 的 作 译 者 已 经 入驻 社区 ， 您 可 以 关注 
他 们 ， 咨 询 技术 问题 ， 可 以 阅读 不 断 更 新 的 技术 文 
章 ， 听 作 译 者 和 编辑 畅 获 好 书 背后 有 趣 的 故事 ， 还 
可 以 参与 社区 的 作者 访谈 栏目 ， 向 您 关注 的 作者 提 
出 采访 题目 ， 


灵活 优惠 的 购书 

您 可 以 方便 地 下 单 购 买 纸 质 图 书 或 电子 图 书 ， 
纸 质 图 书 下 搂 从 人 民 邮 电 出 版 宪 书 库 及 贯 ， 电 子 书 
提 代 多 种 阅读 格式 。 

对 于 重 磅 新 书 ， 社 区 近代 了 预 售 和 新 书 首 及 服 


务 ， 用 户 可 以 第 一 时 间 买 到 心仪 的 新 书 。 


用 户 帐 尸 中 的 积分 可 以 用 于 购书 优 囊 。100 积 
分 =1 元 ， 购 买 图 书 时 ， 在 ， :加 里 项 入 可 使 用 的 
积分 数值 ， 即 可 扣 减 相应 金额 。 





特别 优惠 


购买 本 电子 书 的 读者 专 享 异步 社区 优惠 券 。 使 用 方法 : 注册 成 为 
社区 用 户 ， 在 下 单 购书 时 输入 “57AWG ”， 然 后 点 击 “ 使 用 优惠 码 ”， 即 
可 军 受 电子 书 8 打 优惠 《〈 本 优惠 产 只 可 使 用 一 次 ) 。 


ZK r RBHS JJ 3: 
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软 技能 : 代码 之 外 的 生存 指南 
[2272788 7. ЖИШШ ( John Z. Sonmez ) (作者 ) ETA 8) ШЕН (ERR) 
G 6 9. ОК 


这 星 一 本 真正 从 “人 ” (而 非 技术 也 非 管 理 ) атт tia ARE B58S5535, Баз 
内 容 取 渤 及 生活 习惯 ， 妇 包括 思维 方式 ,凸显 技术 中 “人 ”的 因素 ,全面 讲解 软件 行业 从 业 人 员 所 
TAEHAE "HRR, 

本 书 奈 焦 于 软件 开发 人 员 生 活 的 方方面面 ， 从 揭秘 画 试 的 该 程 到 精 笠 纪 作 出 一 份 杀手 级 简历 ЛАВ 
建 大 专 次 迎 的 博 秋 到 打 坦 你 的 个 人 品牌， 从 提高 自己 工作 效 至 到 与 如 何 与 “ 施 延 年 ”做 斗争 ШЕ 
包括 如 何 投资 不 动产 ， 如 何 关注 自己 的 健康 ， 

本 书 共 分 为 职业 简 ， 上 自我 营销 简 ， 24356. 408. Ена. 8556. е8. US Y sx 
尾行 业 从 业 人 员 所 需 的 “ 软 按 能 ”， 
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什 区 里 还 可 以 做 什么 ? 
Je SZ PJJ TA 
您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘误 被 


确认 后 可 以 获得 100 积 分 。 热 心 勤 误 的 谈 者 还 有 机 
会 参与 书 术 的 审 校 和 翻 详 工 作 。 


写作 


社区 提供 基于 Markdown 的 写作 环境 ， 豆 欢 写 
作 的 您 可 以 在 此 一 斌 身手 ， 在 社区 里 分 盏 您 的 扩 术 
心得 和 读书 体会 ， 更 可 以 体验 目 出 版 的 乐趣 ， 轻 松 


实现 出 版 的 梦想 。 


ДП ЖУЛ Р УЛ ПЕТЕ, АЈ ЗБЕ УТРЕ 
区 提供 的 作者 专 圣 特色 服务 。 


会 议 活动 早 知 道 
您 可 以 掌握 IT 圈 的 技术 会 议 资讯 ， 更 有 机 会 锡 
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加 入 异步 
扫描 任意 二 维 人 码 痢 能 找到 我 们 : 
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ООЖ: 368449889 


社区 网 址 : www.epubit.com.cn 


官方 微 信 异步 社区 


FU: ЛАВЕ, @A RA E h h 
储 -信息 技术 分 社 


投 稳 必 咨询 : contact@epubit.com.cn 


看 完了 

如 未 您 对 本 书 内 容 有 疑 回 ， 可 有 友 邮 件 人 至 
contactDepubit.com.cn， 会 有 编辑 或 作 详 者 协助 答 
疑 。 也 可 访问 卉 步 社 区 ， 参 与 本 书 讨论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 
客服 邮箱 : ebook@epubit.com.cn。 


在 这 里 可 以 找到 我 们 : 


° 做 博 : @ 人 邮 和 异步 社区 
° ОО: 368449889 


